算法度量的考虑
关于算法的度量方式方法有多种,比如当我们写好一个应用部署在一个机器上运行时,可以通过进程监控查看运行的情况,性能等,但是这不太能说明这个应用程序里的某段代码的性能,比如你部署在一个内存比较大的虚拟机上,运行肯定会快些,机器本身的处理器比较优良也会较好的运行你的应用;所以直接通过监控工具查看程序运行性能指标就不能正面反应你的代码质量的优劣。我们知道一段程序代码要执行首先要被计算机读入内存,然后执行,然后输出结果,读数据,执行,输出都涉及到两个方面的消耗,一个是时间,一个是空间,我们在度量代码或者算法优劣的时候主要就从这两个方面来考虑。
算法分析时的假设
但是不同的计算机,读数据的速度,存储数据的空间大小设计,以及写数据的速度是有差异的,这个不用想太多,一个8核,高、64位数的计算机肯定比win86,32位的计算机快,因此我们为了反应一些算法的共性,我们需要做一些假设,一方面我们假设所有的计算机设备里存储一个基本数据,比如说我们创建了一个变量,分配一个空间,那么这个空间就是我们考虑算法性能方面的一个基本的空间单位,space-unit,比如一行代码 定义了一个长度为10的数组,那么这个数组就占用了10个space-unit. 另一方面我们对计算机能执行的一些基本的操作,比如运行某一行代码一次定义为一个时间单位,time-unit,那么一个for循环语句内部的一行数据执行的次数为n,那么这个for语句的时间耗费就记为 T(n) = n; 如果一个for(;i<n,i++)循环语句里面嵌套了另一个for(;j<m;j++)语句,根据数学常识,我们知道外部每次循环的时候内部for语句都将执行m次,因此这个for嵌套结构总共执行次数为n*m;时间复杂度为T(n) = n*m.
时间复杂度的具体分析
如何分析一个算法,或者一段代码的时间复杂度非常重要,为什么重要呢,这相当于给你看别人的代码,你能看懂人家写的代码是好是坏,你自己写代码前,也能对自己的构思有一个基本的考量,如果时间复杂度过大,那么基本上这个写法就可以弃用了,而一般的面试算法的时候,也会让你现场对一个问题提出你的解决方案,同时对你的方案的时间复杂度分析是必然的,肯定会问到你这个方案的时间复杂度是多少,你还是要学会分析,分析时间复杂度的可以很难,可以涉及到很多的数学知识,但是一些常见的算法的复杂度分析还是比较容易的,我们就做好这个分析的基础,一点点的向更难的方向出发。
分析前的一些考虑
实际分析中,我们要考虑这样一些问题,这个算法执行完毕最少要多久?最长要多久?平均要多久?因为我们分析的出发点不同,得到的结论肯定不同,一般情况下,分析一个算法最少要多久没有多少实际意义,因为总会有额外的你意想不到的情况让这个最乐观的情况崩塌;实际中我们常常考虑最差的情况下,一个算法需要多长的时间执行完毕,以及执行的平均时间,因为平均时间就像一个人的平均成绩一样,大致可以反应他的综合学习水平。因此当我们面试的时候,当说到分析算法时间复杂度的时候我们一般分析的都是最坏情况或者平均情况。
第二个考虑的是算法复杂度分析的时候,我们常常会发现对一个算法的具体的执行次数给出一个精确的统计数字是困难的,因此我们常常退而求其次,估算算法的复杂度的量级,比如执行n次与n+2次, 2n+2次都是一个量级的,我们统一把n趋近于无穷大的时候,忽略掉常数和常数因子得到的数量级当作这个算法的最终复杂度量级。类似的还有n*n 与2n*n, 2n*n+2n+1是一个数量级的,都是n的平方。log函数不管底数为多少,只要真数N是一个数量级的,算法都是同一个数量级。
这里借用一个大神的分析方法,给出一段如下的代码,我们来分析一下这段代码的时间复杂度:
这段代码,当我们调用这个cal函数的时候,第二,三行只是执行来一次,计数1+1,第4,5行代码根据for语句循环执行的特点,都执行来n次,总计2n次,第7行代码执行1次,因此这个代码执行的总次数是 2n+3乘以单位时间。
那么我们用T(n)来表示算法的执行时间,f(n)是一个函数表达式,表示执行所有代码的次数总和,我们用O表示一算法执行时间T(n)和f(n)之间的正向相关的函数关系,记为:T(n) = O(f(n)),因此这里我们可以引入一个常量时间的新记法,以大些的O(1)记为执行一个常量级别(1次,2次,3次都是常量级别的)需要的时间。那么以上分析的T(n)=O(2n+3);这种表达方式我们叫做大O时间复杂度表示法。它表达的是时间复杂度随着n规模增长而呈现的变化趋势。而当n趋紧于无穷大的时候,常量因子2,和常量3都可以忽略不计,因此时间复杂度为:O(n).
在面试过程中,曾经被问到过一个问题,也是分析时间复杂度的时候,被问到“O(f(n))”代表什么?我回答的是,如果执行着常数次的计算耗费的时间是O(1),那么这个算法执行n次计算,需要的时间是O(n)。简单的说明你懂得这个大O和时间复杂度的正向关系就可以了。
同理当我们有更多的内嵌的其他语句的时候,我们秉承着这样的分析原则,计算执行次数,并且根据n趋近于无穷大的时候,忽略常量因子和常数,取最大的数量级就是我们算法最终表示的时间复杂度。
这里不图多分析,好好的分析一个简单的,清楚明了的懂得分析的过程和取舍原则,其他情况也是相通的。
空间复杂度
空间复杂度的分析方式和时间复杂度类似,还是从大神那里找了个例子,如下代码,只有当我们在声明数组a的时候,向内存申请了空间大小为n的单位空间,其他的比如说i 可以认为只是一个单位空间,因此这段代码的空间复杂度可以认为是O(n);
不求多,不求深,但求理解,然后再选择性的深入了解,这是我在学习算法中深有感触的,一开始看数据结构与算法的书籍的时候是大学时期的统一教本严蔚敏的那本,难的我头都大了,完全不知道从何下手,一句话要看很多遍也不能很好的理解,后来多方面学习,发现就是先学一个简单明了的分析方法,去除一些计算机底层的细节知识更加符合初学者的学习曲线。
接下来的章节将讲到数据结构和算法的关系。