原题目:[1], [2]
[1]: https://www.jianshu.com/p/63b780a3157a
[2]: https://blog.csdn.net/Koala_Tree/article/details/78932316
题目要求:
给你一根长度为n
的绳子,请把绳子剪成m
段,记每段绳子长度为k[0], k[1], ..., k[m-1]
,求k[0]*k[1]*...*k[m-1]
的最大值。已知绳子长度n
为整数,m > 1
(至少要剪一刀,不能不剪),k[0], k[1], ..., k[m-1]
均要求为整数。
贪心算法及证明
贪心算法给出的解为:
n <= 1
时,无解(一刀也剪不了)n in [2, 3, 4, 5]
时,分别剪成1*1 == 1, 2*1 == 2, 2*2 == 4, 3*2 == 6
n >= 6
(或放宽到n >= 4
)时,存在a in N*
及b in [0,1,2]
使得n == 3*a + 2*b
,剪出a
段长度为3
的绳子以及b
段长度为2
的绳子,最大值为3**a * 2**b
由于解是确定的,因而可以在
O(1)
时间内计算完成。
但是通常这种直接给出的解都要附上证明(不仅仅是面试官要证明,任何一个思维严谨一点的人都需要证明),[1]只是简单提及该解而没有证明,[2]有简短的证明但不够完整(3*(n-3) >= 2*(n-2)
没问题,但是4*(n-4)
或者5*(n-5)
行不行?),这里尝试列出我自己的证明过程。
假设m
可以等于1
,记P(n) = reduce(operator.mul, k_best, initializer=1)
为n
固定、m
和k
数组均为最优时,k[0], k[1], ..., k[m-1]
连乘积的最大值。
n in [1, 2, 3]
时,为使P(n)
达到最大值,需要m == 1
,此时P(n)
也分别为1, 2, 3
,与题目要求的最大值稍有不同。n >= 4
时,P(n) >= n
,可以忽略m == 1
的情况,使P(n)
的最大值与题目要求的最大值相同。
这里[2]是通过2*(n-2) >= n
以及3*(n-3) > n
这两个反例说明的,而我想到的是折半相乘,即:
对于a in N*, a >= 2
,偶数n == 2*a
有a*a >= 2*a == n
,奇数n == 2*a + 1
有a*(a+1) >= a*a + a > 2*a + 1 == n
n
足够小(4 <= n <= 9
)时,最优剪法是固定的(2*2 == 4, 3*2 == 6, 3*3 == 9, 2*2*3 = 12, 2*3*3 == 18, 3*3*3 == 27
)。-
对于
n >= 10
的情况:- 考虑先剪一刀变成
6
和n - 6
,易(xian)知(ran)P(n) >= P(6) * P(n-6)
(这里我不太想要P(n) >= 6 * (n-6)
这一结论,意义不大),且两段长度都大于等于4
,所以两段都继续剪下去比较好。 - 使用递归思想继续剪每段绳子。长度小于等于
1
的绳子完全不会出现,而由于n >= 4
时P(n) >= n
,长度大于等于4
的绳子依然要继续剪下去。最终剩下若干长度为2
或3
的绳子,且易(xian)知(ran)P(n)
达到最大值时也只能剪出这两种绳子。 - 如果长度为
2
的绳子多于等于三条,取三条合并起来,由于计算P(6)
时有3*3 == 9 > 2*P(4) == 8
,将其重新剪成两条长度为3
的绳子,可以使连乘积增大。 - 最终结果一定是剪出若干长度为
3
的绳子以及不超过两条长度为2
的绳子,也就是原答案的第3条。
这里
n >= 10
也可以放宽到n >= 8
,只要保证第一刀剪出的两段都大于等于4
即可。甚至由于我们是在计算P(n)
而不是直接计算题目要求的最大值,条件还可以放宽到n >= 6
,第一刀剪出的两段都大于等于2
即可。 - 考虑先剪一刀变成
另一种可能的算法
记P(n, m)
为n, m
两个数都固定时,k[0], k[1], ..., k[m-1]
连乘积的最大值。对于n >= 4
的情况,遍历m
,求P(n, m)
的最大值。这里有两个结论:
- 易(xian)知(ran)
m <= n / 2
,否则会剪出长度为1
的绳子,浪费绳子的长度;而题目又给定了m >= 2
这一下界,故需求解n / 2 - 1
个P(n, m)
并取最大值。
这一层循环的时间复杂度在求单个P(n, m)
的基础上增加了O(n)
。 - 每次固定
m
后,最优的k[0], k[1], ..., k[m-1]
一定是平均分布的,最大最小值之差不超过1
。设a = floor(n/m)
,b = n - a * m
,则k[0], k[1], ..., k[m-1]
一定包含m - b
个a
和b
个a + 1
。
对于k[0], k[1], ..., k[m-1]
可以取实数值的情况,这里直接套用大名鼎鼎的均值不等式即可;但是对于题目要求只能取整数值的情况,我们在不做计算的情况下不太容易说明4 * 4 * 4
比3 * 3 * 6
要好。这种情况下可以参考证明均值不等式的局部调整法(英文维基百科或百度文库),该方法在自然数集上仍然可以正常操作。
假设k[0], k[1], ..., k[m-1]
是升序排列的,若b > 0
(即m
未能整除n
),则k[0] <= a
且k[m-1] >= a + 1
,否则k[0] <= a
且k[m-1] >= a
。若任一不等式取到等号,则将相应的k[0]
或k[m-1]
从集合中分离出去(无需再调整)。这里讨论b > 0
,k[0] < a
且k[m-1] > a + 1
的情况,b == 0
但仍需调整的情况与之类似。
我们希望让k[0]
及k[m-1]
分别靠近n/m
及k[0] + k[m-1] - n/m
。调整的步长为step = min(a - k[0], k[m-1] - (a + 1))
,则step > 0
,k[0] < k[0] + step <= a
,a + 1 <= k[m-1] - step < k[m-1]
,且两个小于等于号至少有一个取等号。
由二次函数的凸性易(xian)知(ran)k[0] * k[m-1] < (k[0] + step) * (k[m-1] - step) <= floor(((k[0] + k[m-1]) / 2.0) ** 2)
。(这里的调整步长step
不是全局最优的,上式的小于等于号一般无法取到等号。)
令(k[0], k[m-1]) = (k[0] + step, k[m-1] - step)
,调整后整个数组k
的连乘积增大。
每次调整后将k[0]
及k[m-1]
重新插入k[1:-2]
,使整个数组k
保持升序即可。
有此结论后,对于每个固定的m
,求P(n, m)
的时间复杂度为O(1)
。
整个算法的时间复杂度为O(n)
。