从广义上讲:数据结构就是指一组数据的存储结构。算法就是操作数据的一组方法。数据结构和算法是相辅相成的。他们解决的是如何更省、更快地存储和处理数据的问题,因此,我们就需要一个考量效率和资源消耗的方法,这就是复杂度分析方法。复杂度分析又分为:时间复杂度和空间复杂度。
一、时间复杂度
1、时间复杂度表示法
大 O 时间复杂度表示法。大 O 时间复杂度实际上并不具体表示代码真正的执行时间,而是表示代码执行时间随数据规模增长的变化趋势,所以,也叫作渐进时间复杂度(asymptotic time complexity),简称时间复杂度。
T(n) 表示代码执行的时间;n 表示数据规模的大小;f(n) 表示每行代码执行的次数总和。因为这是一个公式,所以用 f(n) 来表示。公式中的 O,表示代码的执行时间 T(n) 与 f(n) 表达式成正比。
2、时间复杂度分析:
1) 只关注循环执行次数最多的一段代码
2) 加法法则:总复杂度等于量级最大的那段代码的复杂度。
时间复杂度的概念来说,它表示的是一个算法执行效率与数据规模增长的变化趋势,所以不管常量的执行时间多大,我们都可以忽略掉。因为它本身对增长趋势并没有影响。
3) 乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积 Eg: 嵌套循环。
(时间复杂度和空间复杂度不需要考虑系数,它是关于n的函数,用来描述数量级;当然个别情况时,不可以忽略,如比较几个排序算法好坏时,此处不多赘述。)
3、几种常见时间复杂度
时间复杂度 | 描述 |
---|---|
O(1) | 常数复杂度 |
O(log n) | 对数复杂度 |
O(n) | 线性时间复杂度 for |
O(n2) | 平方 for for |
O(n3) | 立方 for for for |
O(kn) | 指数 |
O(n!) | 阶层 |
1)Ο(1)
只要代码的执行时间不随 n 的增大而增长,这样代码的时间复杂度我们都记作 O(1)。或者说,一般情况下,只要算法中不存在循环语句、递归语句,即使有成千上万行的代码,其时间复杂度也是Ο(1)。
2)O(logn)
i=1;
while (i <= n) {
i = i * 2;
}
[图片上传失败...(image-2a9e2b-1676209645959)]
我们只要知道 x 值是多少,就知道这行代码执行的次数了。通过 2x=n 求解 x。x=log2n,所以,这段代码的时间复杂度就是 O(log2n)。
i=1;
while (i <= n) {
i = i * 3;
}
这段代码的时间复杂度为 O(log3n)。
log3n =log32 * log2n,log32 是一个常量。因此,在对数阶时间复杂度的表示方法里,我们忽略对数的“底”,统一表示为 O(logn)。典型应用二分查找n个数中找到指定值 , 复杂度 O(logn),一维有序矩阵的二分查找 O(logn)。
3)O(nlogn)
如果一段代码的时间复杂度是 O(logn),我们循环执行 n 遍,时间复杂度就是 O(nlogn) 了。而且,O(nlogn) 也是一种非常常见的算法时间复杂度。比如,归并排序、快速排序的时间复杂度都是 O(nlogn),所有排序算法最优的就是O(nlogn)。
4)O(n)
for (; i < n; ++i) {
}
典型应用,单层for循环是O(n),二叉树遍历 O(n) ,二维有序矩阵的二分查找 O(n) ,深度优先遍历(DFS)和广度优先遍历(BFS)是O(n) 。 如果for循环并列,相当于o(2n)不关心系数,还是o(n)。
5)O(m+n)、O(m*n)
int cal(int m, int n) {
int sum_1 = 0;
int i = 1;
for (; i < m; ++i) {
sum_1 = sum_1 + i;
}
int sum_2 = 0;
int j = 1;
for (; j < n; ++j) {
sum_2 = sum_2 + j;
}
return sum_1 + sum_2;
}
m 和 n 是表示两个数据规模。我们无法事先评估 m 和 n 谁的量级大,所以我们在表示复杂度的时候,就不能简单地利用加法法则,省略掉其中一个。所以,上面代码的时间复杂度就是 O(m+n)。
6)O(n2)、O(n3)
典型的嵌套for循环,冒泡排序都是O(n2),三层for循环O(n3)。
7)O(kn)
指数级。k为常数可以是2n,3n,4n……。
典型的应用斐波那契数列(递归函数)。
斐波那契数列
,又称黄金分割数列,指的是这样一个数列:0、1、1、2、3、5、8、13、21、34、……它后面的一个数是前两个数之和。在数学上,斐波纳契数列以如下被以递归的方法定义:F(0)=0,F(1)=1,F(n)=F(n-1)+F(n-2)(n≥2,n∈N*)。
即:
int fib (int n){
if(n<2) return n;
return fib(n-1)+fib(n-2);
}
递归的时间复杂度分析:可以假设n为一个合适的比较小的值,画递归树进行分析。
总结点数=斐波那契执行次数
。eg:fib(5)总结点数等于前三层总结点数加上最底层2个节点数,fib(5)=23-1+2=9。
二叉树的层数(高度)是 n - 1,所以递归树总结点数等于高度-1层(也就是n-2层)所有节点数加上最底层2个节点。
即fib(n)=2(n-2)-1+2=2(n-2)+1,所以T(n)=O(fib(n))=O(2n).。
【补充】主定理,用于解决如何计算所有递归函数的时间复杂度:主定理(英语:master theorem)提供了用渐近符号(大O符号)表示许多由分治法得到的递推关系式的方法。
分治法的精髓:
- 分--将问题分解为规模更小的子问题;
- 治--将这些规模更小的子问题逐个击破;
- 合--将已解决的子问题合并,最终得出“母”问题的解;
8)O(n!)
典型应用求有N个元素的全排列的算法。
4、时间复杂度曲线区别分析
Eg:计算1+2+3+......+n;
方法一:从1到n循环累加;
y=0;
for (int i=1; i < n; ++i) {
y+=i;
}
方法二:用公式 n(n+1)/2
方法一时间复杂度O(n) 方法二时间复杂度O(1),相同结果代码不同导致时间复杂度差距很大,从曲线图中能看出,尤其当n越大,影响越明显。(所以平时开发代码要优化)。
二、空间复杂度
1、空间复杂度概念
渐进空间复杂度(asymptotic space complexity),表示算法的存储空间与数据规模之间的增长关系。也是O表示法。
2、常见的空间复杂度
我们常见的空间复杂度O(1)、O(n)、O(n2 ),像 O(logn)、O(nlogn) 这样的对数阶复杂度平时都用不到。
一维数组空间复杂度 O(n)。
二维数组展开n*n 空间复杂度即O(n2)。
3、空间复杂度分析
空间复杂度的分析:数组的长度,递归的深度。
Eg1:
void print(int n) {
int i = 0;
int[] a = new int[n];
for (i; i <n; ++i) {
a[i] = i * i;
}
for (i = n-1; i >= 0; --i) {
print out a[i]
}
}
跟时间复杂度分析一样,我们可以看到,第 2 行代码中,我们申请了一个空间存储变量 i,但是它是常量阶的,跟数据规模 n 没有关系,所以我们可以忽略。第 3 行申请了一个大小为 n 的 int 类型数组,除此之外,剩下的代码都没有占用更多的空间,所以整段代码的空间复杂度就是 O(n)。
Eg2:经典的爬楼梯问题:
输入台阶级数,求一共多少走法,每次可以爬一个台阶,也可以爬两个。
思路:n级台阶的走法=先走一级后,n-1级台阶走法+先走二级后,n-2级台阶走法。即f(n)=f(n-1)+f(n-2)。
方法一
:递归写法
时间复杂度O(2n),树形递归的大小为2n。
空间复杂度为O(n),树深度最大n。
方法二
:用数组中间转换
时间复杂度O(n),单循环到n。
空间复杂度为O(n),dp数组用了n的空间。
方法三
:变量中转
时间复杂度O(n),单循环到n,需要计算第n个斐波那契数。
空间复杂度为O(1),使用常量级的空间。