算法概论笔记 - 分治法

  1. 将原问题分解为一组子问题,每个子问题都与原问题类型相同,但是比原问题的规模小
  2. 递归求解这些子问题
  3. 将子问题的求解结果恰当合并,得到原问题的解

分治算法更多地是使已经能在多项式时间内解决的问题求解得更快。

二进制乘法

假设x和y是两个n位二进制整数,我们将每个数都一分为二,每个数的左半部分和右半部分都是n/2位二进制数:

![](http://latex.codecogs.com/svg.latex?xy = (2^{n/2}x_L + x_R)(2^{n/2}y_L + y_R) = 2^nx_Ly_L + 2^{n/2}(x_Ly_R + x_Ry_L) + x_Ry_R)

此时,T(n) = 4T(n/2) + O(n),时间复杂度为O(n^2)

![](http://latex.codecogs.com/svg.latex?x_Ly_R + x_Ry_L = (x_L + x_R)(y_L + y_R) - x_Ly_L - x_Ry_R)

这时,T(n) <= 3T(n/2 + 1) + O(n),时间复杂度为
矩阵乘法

两个nn的矩阵X和Y的乘积得到另一个nn的矩阵Z=XY

直接计算

时间复杂度=![](http://latex.codecogs.com/svg.latex?n^2*O(n) = O(n^3)​)

元素数目*每个元素的计算时间

分治优化

利用矩阵乘法能够分块进行的特性

![](http://latex.codecogs.com/svg.latex?X =\begin{pmatrix}A & B\C & D\\end{pmatrix})

![](http://latex.codecogs.com/svg.latex?Y =\begin{pmatrix}E & F\G & H\\end{pmatrix})

从而,

![](http://latex.codecogs.com/svg.latex?XY =\begin{pmatrix}A & B\C & D\\end{pmatrix}\begin{pmatrix}E & F\G & H\\end{pmatrix}=\begin{pmatrix}AE+BG & AF+BH\CE+DG & CF+DH\\end{pmatrix}=\begin{pmatrix}P_5+P_4-P_2+P_6 & P_1+P_2\P_3+P_4 & P_1+P_5-P_3-P_7\\end{pmatrix})
其中,
![](http://latex.codecogs.com/svg.latex?\quad P_1=A(F-H)\quad P_2=(A+B)H\quad P_3=(C+D)E\quad P_4=D(G-E)\quad P_5=(A+D)(E+H)\quad P_6=(B-D)(G+H)\quad P_7=(A-C)(E+F))

算法T(n) = 7T(n/2) + O(n^2),根据主定理可得,

时间复杂度=
递归树视角:

算法的递归调用构成一个树状结构。在深度为k的层次上,共有

个子问题,每一个的规模都是
,该层次花费的时间为
。在
的层次上,子问题的规模降为1,此时![](http://latex.codecogs.com/svg.latex?(\frac32)^{log_2n}O(n) = 3^{log_2n} = n^{log_23})

换底公式![](http://latex.codecogs.com/svg.latex?log_ab = \frac {log_cb}{log_ca})

对于二进制乘法,通常不需要将子问题的规模降至1。对于大多数处理器而言,16位或32位的二进制乘法都被视为一次单独的操作

通用模式

在解决规模为n的问题时,总是先递归地求解a个规模为n/b的子问题,然后再

时间内将子问题的解合并起来,其中a>0,b>1,d>=0是一些特定的整数。
此时,主定理:![](http://latex.codecogs.com/svg.latex?T(n) = aT(\lceil n/b \rceil) + O(n^d))
时间复杂度为
![](http://latex.codecogs.com/svg.latex?T(n) =\begin{cases}O(n^d) & if ; d > log_ba \O(n^dlogn) & if ; d = log_ba \O(n^{log_ba}) & if ; d < log_ba \\end{cases})

归并排序

将该数的序列分为两部分,递归地对每一部分进行排序,最后将两个有序子序列进行合并

merge
function merge(x[1...k], y[1...l])
if k=0: return y[1...l]
if l=0: return x[1...k]
if x[1] <= y[1]:
    return x[1]+merge(x[2...k],y[1...l])
else:
    return y[1]+merge(x[1...k],y[2...l])

merge()时间复杂度为O(k+l),即线性时间
mergesort()满足T(n) = 2T(n/2) + O(n),根据主定理可得时间复杂度为O(nlogn)

merge()的实现通常面临两个选择:

  1. 线性附加内存,花费将数据拷贝到临时数组再拷贝回来的附加工作
  2. 交换位置(类似插入排序),若y半段对应元素较小,则面临将x半段对应元素至x半段末尾的元素的这一子段全体右移一位的代价

做法2可能会使归并排序退化为插入排序,因此通常选择线性附加内存

function merge(x[1...k], y[1...l])
init empty z[1...k+l]
xPos, yPos, zPos -> 1

while xPos <= k && yPose <= l:
    if x[xPos] <= y[yPos]:
        z[zPos++] = x[xPos++]
    else:
        z[zPos++] = y[yPos++]:

while xPos <= k
    z[zPos++] = x[xPos++]
while yPos <= l
    z[zPos++] = y[yPos++]
    
copy temp array z back

任一时刻只需要一个临时数组,因此该临时数组可以仅存有一个,merge()使用该临时数组的任意部分

递归版
function mergesort(a[1...n])
Input: An array of number a[1...n]
Output: A sorted version of this array

if n > 1:
    return merge(mergesort(a[1...n/2]),
                mergesort(a[n/2+1...n]))
else:
    return a

see implement: divide.MergeSortRecur

迭代版

可以发现,合并操作直到递归进入到单元素数组的层次时才真正开始,1->2->4->8...依次类推(类似自底向上)

function iterative-mergesort(a[1...n])
Input: elements a1, a2, ..., an to be sorted

Q = [] (an empty queue whose elment's type is array)
for i = 1 to n:
    inject(Q, [ai])
while |Q| > 1:
    inject(Q, merge(eject(Q), eject(Q)))
return eject(Q)

see implement: divide.MergeSortIter

扩展

在Java的泛型排序(使用Comparator)中,进行一次元素比较可能比较昂贵(因为比较可能不容易被内嵌,从而动态调度的开销可能会减慢执行的速度),但是移动元素则是省时的(因为它们是引用的赋值,而不是庞大对象的拷贝)。归并算法使用所有流行的排序算法中最少的比较次数,因此,它就是标准Java类库中泛型排序所使用的的算法。

通过两两元素之间的比较进行排序,必须要执行O(nlogn)次比较操作。
原因
通过两两元素之间的比较进行排序的算法可以通过树结构来描述,树的每个叶节点都标记一个关于原输入元素序列的排列。从树根节点到树叶节点的最长路径上的比较次数为该算法时间复杂度的最差情况。

该二叉树至少包含有n!个叶节点(排列数目),因此这棵树的宽度至少是

,因此最差情况下必须要执行O(nlogn)次比较操作,即算法复杂度为O(nlogn)

选择S中第k小元素
普通策略
  1. 排序问题:对S进行排序,返回相应位置k的元素
  2. 取S中k个最小数的问题:将S中前k个元素读入(某数据结构)并以递减顺序对其进行排序。接着,逐个读入剩下的元素,若该元素大于第k个元素,则忽略它;否则将其放至(某数据结构)中正确的位置,同时将第k个元素挤出。当算法终止时,位于第k个位置上的元素作为答案返回

其中某数据结构可以是数组、二叉堆、等等

分治策略

对于任意给定的数v,S中的数被分成三组:

  1. ,比v小的数

  2. ,与v相等的数

  3. ,比v大的数
    搜索范围缩小,转而在S的三个子集中进行:
    ![](http://latex.codecogs.com/svg.latex?selection(S, k) =\begin{cases}selection(S_L, k) & if ; k<=|S_L| \v & if ; |S_L| < k <= |S_L| + |S_V| \selection(S_R, k-|S_L|-|S_V|) & if ; k > |S_L| + |S_V| \\end{cases})

在理想情况下,算法T(n) = T(n/2) + O(n),时间复杂度为O(n)

基准v的选择see also 快速排序

分治策略的实现

由于需要多维护一个

,partition()中将S分为
,
,

三个子集不易实现。


其中基准v为5,指针l左侧l为比基准v小的数,而指针m左侧为不超过基准的数。当分割时遇到比基准小的数时,需要将

两个子集整体向右移动一位,耗费极大时间

因此,实现时可将上述的三组放宽为:

  1. ,不超过v的数

  2. v
  3. ,不小于v的数

显然,该变形不改变正确性

see implement: divide.FindKMin

快速傅里叶(Fourier)变换
值表示法

多项式具有如下性质

一个d次多项式被其在d+1个不同点处的取值所唯一确定
如:d=1时,即任意两点确定一条直线

该性质引出d次多项式的值表示法。

因此,对于一个d次多项式
![](http://latex.codecogs.com/svg.latex?A(x) = a_0 + a_1x^1 + a_2x^2 + ... + a_dx^d)
有如下两种表示法(该表示法能够唯一确定该多项式):

  1. 系数表示法:多项式的系数a_0, a_1, a_2 .... a_d
  2. 值表示法:A(x_0), A(x_1), A(x_2) .... A(x_d)的值

在值表示法下,对于多项式相乘问题,只要把

相乘,即可得到
的值,多项式相乘成为线性问题

在多项式乘法中,只要将多项式的变量x换成基数2,并留意进位,即可得到二进制乘法
多项式乘法的应用:信号处理
系数表示法和值表示法可以相互转换,系数到值的过程称为计算,值到系数的过程称为插值

求解多项式相乘(A*B=C)

计算这步时间复杂度为

若对![](http://latex.codecogs.com/svg.latex?x_0, x_1, ..., x{n-1})的选取有一定技巧,则可使计算过程之间产生重复步骤,从而节省算法的时间。快速

变换就是基于此将时间复杂度降为

若选择它们为正负数对,即![](http://latex.codecogs.com/svg.latex?+-x_0, +-x_1, ...., +-x_{n/2-1})。若以

为例,将它的奇次幂和偶次幂分离,则,

![](http://latex.codecogs.com/svg.latex?= (3+4x+6x^2) + x(4+2x2+10x4) = A_e(x^2) + xA_o(x^2))

则,

![](http://latex.codecogs.com/svg.latex?A(x_i) = A_e(x_i^2) + x_iA_o(x_i^2))

![](http://latex.codecogs.com/svg.latex?A(-x_i) = A_e(x_i^2) - x_iA_o(x_i^2))

若对于正负数对的使用从递归顶层一直到到底层,那么其运算时间满足

![](http://latex.codecogs.com/svg.latex?T(n) = 2T(n/2) + O(n))

假设我们底层选择的数选择为1,那么递归顶层选择的n个数,它们应该是,1的n次复根,即等式![](http://latex.codecogs.com/svg.latex?z^n = 1) 的n个复数解。

复根的理解如下:

插值TODO
写在最后
  • 立个Flag,TODO will be done some day。
  • 渣代码,且轻喷​:worried:​。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,186评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,858评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,620评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,888评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,009评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,149评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,204评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,956评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,385评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,698评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,863评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,544评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,185评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,899评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,141评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,684评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,750评论 2 351

推荐阅读更多精彩内容

  • 算法和数据结构 [TOC] 算法 函数的增长 渐近记号 用来描述算法渐近运行时间的记号,根据定义域为自然数集$N=...
    wxainn阅读 1,060评论 0 0
  • 1 序 2016年6月25日夜,帝都,天下着大雨,拖着行李箱和同学在校门口照了最后一张合照,搬离寝室打车去了提前租...
    RichardJieChen阅读 5,085评论 0 12
  • 概述:排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    每天刷两次牙阅读 3,729评论 0 15
  • #define UIColorFromRGB(rgbValue) [UIColor colorWithRed:((...
    keelZJP阅读 172评论 0 0