原题目:[1], [2]
[1]: https://www.jianshu.com/p/63b780a3157a
[2]: https://blog.csdn.net/Koala_Tree/article/details/78932316
题目要求:
给你一根长度为n的绳子,请把绳子剪成m段,记每段绳子长度为k[0], k[1], ..., k[m-1],求k[0]*k[1]*...*k[m-1]的最大值。已知绳子长度n为整数,m > 1(至少要剪一刀,不能不剪),k[0], k[1], ..., k[m-1]均要求为整数。
贪心算法及证明
贪心算法给出的解为:
n <= 1时,无解(一刀也剪不了)n in [2, 3, 4, 5]时,分别剪成1*1 == 1, 2*1 == 2, 2*2 == 4, 3*2 == 6n >= 6(或放宽到n >= 4)时,存在a in N*及b in [0,1,2]使得n == 3*a + 2*b,剪出a段长度为3的绳子以及b段长度为2的绳子,最大值为3**a * 2**b由于解是确定的,因而可以在
O(1)时间内计算完成。
但是通常这种直接给出的解都要附上证明(不仅仅是面试官要证明,任何一个思维严谨一点的人都需要证明),[1]只是简单提及该解而没有证明,[2]有简短的证明但不够完整(3*(n-3) >= 2*(n-2)没问题,但是4*(n-4)或者5*(n-5)行不行?),这里尝试列出我自己的证明过程。
假设m可以等于1,记P(n) = reduce(operator.mul, k_best, initializer=1)为n固定、m和k数组均为最优时,k[0], k[1], ..., k[m-1]连乘积的最大值。
n in [1, 2, 3]时,为使P(n)达到最大值,需要m == 1,此时P(n)也分别为1, 2, 3,与题目要求的最大值稍有不同。n >= 4时,P(n) >= n,可以忽略m == 1的情况,使P(n)的最大值与题目要求的最大值相同。
这里[2]是通过2*(n-2) >= n以及3*(n-3) > n这两个反例说明的,而我想到的是折半相乘,即:
对于a in N*, a >= 2,偶数n == 2*a有a*a >= 2*a == n,奇数n == 2*a + 1有a*(a+1) >= a*a + a > 2*a + 1 == nn足够小(4 <= n <= 9)时,最优剪法是固定的(2*2 == 4, 3*2 == 6, 3*3 == 9, 2*2*3 = 12, 2*3*3 == 18, 3*3*3 == 27)。-
对于
n >= 10的情况:- 考虑先剪一刀变成
6和n - 6,易(xian)知(ran)P(n) >= P(6) * P(n-6)(这里我不太想要P(n) >= 6 * (n-6)这一结论,意义不大),且两段长度都大于等于4,所以两段都继续剪下去比较好。 - 使用递归思想继续剪每段绳子。长度小于等于
1的绳子完全不会出现,而由于n >= 4时P(n) >= n,长度大于等于4的绳子依然要继续剪下去。最终剩下若干长度为2或3的绳子,且易(xian)知(ran)P(n)达到最大值时也只能剪出这两种绳子。 - 如果长度为
2的绳子多于等于三条,取三条合并起来,由于计算P(6)时有3*3 == 9 > 2*P(4) == 8,将其重新剪成两条长度为3的绳子,可以使连乘积增大。 - 最终结果一定是剪出若干长度为
3的绳子以及不超过两条长度为2的绳子,也就是原答案的第3条。
这里
n >= 10也可以放宽到n >= 8,只要保证第一刀剪出的两段都大于等于4即可。甚至由于我们是在计算P(n)而不是直接计算题目要求的最大值,条件还可以放宽到n >= 6,第一刀剪出的两段都大于等于2即可。 - 考虑先剪一刀变成
另一种可能的算法
记P(n, m)为n, m两个数都固定时,k[0], k[1], ..., k[m-1]连乘积的最大值。对于n >= 4的情况,遍历m,求P(n, m)的最大值。这里有两个结论:
- 易(xian)知(ran)
m <= n / 2,否则会剪出长度为1的绳子,浪费绳子的长度;而题目又给定了m >= 2这一下界,故需求解n / 2 - 1个P(n, m)并取最大值。
这一层循环的时间复杂度在求单个P(n, m)的基础上增加了O(n)。 - 每次固定
m后,最优的k[0], k[1], ..., k[m-1]一定是平均分布的,最大最小值之差不超过1。设a = floor(n/m),b = n - a * m,则k[0], k[1], ..., k[m-1]一定包含m - b个a和b个a + 1。
对于k[0], k[1], ..., k[m-1]可以取实数值的情况,这里直接套用大名鼎鼎的均值不等式即可;但是对于题目要求只能取整数值的情况,我们在不做计算的情况下不太容易说明4 * 4 * 4比3 * 3 * 6要好。这种情况下可以参考证明均值不等式的局部调整法(英文维基百科或百度文库),该方法在自然数集上仍然可以正常操作。
假设k[0], k[1], ..., k[m-1]是升序排列的,若b > 0(即m未能整除n),则k[0] <= a且k[m-1] >= a + 1,否则k[0] <= a且k[m-1] >= a。若任一不等式取到等号,则将相应的k[0]或k[m-1]从集合中分离出去(无需再调整)。这里讨论b > 0,k[0] < a且k[m-1] > a + 1的情况,b == 0但仍需调整的情况与之类似。
我们希望让k[0]及k[m-1]分别靠近n/m及k[0] + k[m-1] - n/m。调整的步长为step = min(a - k[0], k[m-1] - (a + 1)),则step > 0,k[0] < k[0] + step <= a,a + 1 <= k[m-1] - step < k[m-1],且两个小于等于号至少有一个取等号。
由二次函数的凸性易(xian)知(ran)k[0] * k[m-1] < (k[0] + step) * (k[m-1] - step) <= floor(((k[0] + k[m-1]) / 2.0) ** 2)。(这里的调整步长step不是全局最优的,上式的小于等于号一般无法取到等号。)
令(k[0], k[m-1]) = (k[0] + step, k[m-1] - step),调整后整个数组k的连乘积增大。
每次调整后将k[0]及k[m-1]重新插入k[1:-2],使整个数组k保持升序即可。
有此结论后,对于每个固定的m,求P(n, m)的时间复杂度为O(1)。
整个算法的时间复杂度为O(n)。