一、是什么:衡量算法代码的执行效率的方法
二、地位:数据结构和算法学习的精髓
三、解决了什么问题:在设计程序、编码阶段就可以对代码的执行效率有一个大体上的认识,作为指导帮助我们编写出更高效的代码。
四、有没有其他衡量代码效率的方法?
肯定有的,比如直接把代码运行一次得到精确的算法执行时间和占用的内存大小。这种方法叫事后统计法。
这种方法的有很大的局限性:
1. 测试结果非常依赖测试环境
即同样的代码,在 i9 处理器上肯定就比 i3 处理器运行的快一点。还有可能出现,在这台机器上 a 代码跑的比 b 代码快,在另一台机器上却出现截然相反的结果。
2. 测试结果受数据规模和内容影响很大
比如,在数据量小时,可能出现插入排序比快排还要快的情景。或者,在数据接近正序和数据接近逆序两种情况下,跑出来的一些排序代码,速度相差很大。
与事后统计法相对比,复杂度分析方法有更通用的优势,是从原理出发看效率,而事后统计法当然就是从结果看效率。
两者不是互斥的,相反应该结合起来使用,更有助于我们写出质量更好的项目。
五、分析的具体方法:
代码执行时间 T(n)=O(f(n))
其中 T(n) 表示代码执行的时间,n 表示数据规模的大小,f(n) 表示每行代码执行的次数总和。
其中 大 O 时间复杂度实际上并不具体表示代码执行的时间,而是表示代码执行时间随数据规模增长的变化趋势,,所以,也叫渐近时间复杂度,简称时间复杂度。
1. 只关注执行循环最多的一段代码,总复杂度等于量级最大那段代码的复杂度
2. 嵌套代码的复杂度等于嵌套内外代码复杂度的乘积。
六、几种常见的复杂度:
常量阶 O(1)、对数阶 O(logn)、线性阶 O(n)、线性对数阶 O(nlogn)、平方阶 O(n^2)、立方阶 O(n^3)、K 次方阶 O(n^k)、
指数阶 O(2^n)、阶乘阶 O(n!)
对这些复杂度量级,可以分为多项式量级和非多项式量级。其中非多项式量级只有指数阶和阶乘阶,这两个量级的算法问题又叫做 NP 难问题。
七、对 O(nlogn) 的理解
当已处理的数据规模呈等比数列级别时,代码的复杂度就是对数级别 O(logn)。而 O(nlogn) 和 O(logn) 联系其实很紧密,将 O(logn) 级别的代码执行 O(n) 级别的次数,就是 O(nlogn) 了。
八、对 O(m+n)、 O(m*n) 的理解
之所以有两个参数,是因为代码的复杂度由两个数据的规模决定。因为无法实现知道 m 和 n 两个数据规模谁更大,所以只能都写出来。
九、同时间复杂度,空间复杂度表示的方法也是大 O 表示法。把每一份申请的空间存储都看成一样大,计算申请空间的规模趋势就是空间复杂度。
十、课后思考
问:有人说,我们项目之前都会进行性能测试,再做代码复杂度分析、空间复杂度分析,是不是多次一举呢?而且,每段代码都分析一下时间复杂度、空间复杂度,是不是很浪费时间呢?
答:我不认为是多此一举,渐进时间、空间复杂度分析给我们提供了一个很好的理论分析方法,它让我们脱离具体宿主环境来对我们的程序代码又一个大致的认识,让我们知道,最好、最坏、平均情况下我们代码执行的效率如何。同时也方便了我们进行交流,我们可以说,这个算法的复杂度是 O(n),那个算法的复杂度是 O(logn),这样我们就对算法有了一个感性的认识。
当然,渐进时间、空间复杂度分析都是理论上的,我们不能断定一个 O(logn) 级别的算法就一定优于 O(n) ,针对不同的宿主机器,数据集,跑出来的性能差别会不同。所以我认为针对不同的实际情况进行一定的性能测试是必要的。
综上所述,渐进时间、空间复杂度分析并不冲突。在实际情况中、一个低阶的算法极有可能比一个高阶算法效率高,