为什么要学习数据结构和算法
- 问自己你想一辈子当一个CRUD BOY吗?这句话深深的刺痛了我。在看到这个文章之前,我还以为自己掌握了一些设计模式,写了一些项目的代码就技术上可以了呢。当看到这句话的时候,我终于意识到其它我之前的代码水平也就是一个CRUD BOY。。。
- 更好的理解和使用框架和三方技术。在日常业务开发中,我们可能不会经常的使用到数据结构和算法的知识。但一些优秀的框架一定是基于优秀的系统设计的,而优秀的设计就会包含:算法,好的代码写法,设计模式等闪光点。所以,掌握了数据结构可能更好的理解,也就能更好的使用框架和三方技术,帮助我们在工作中事半功倍。
- 更好的解决问题。随着工作时间的增长,我们不是一直在做CRUD BOY,有时会有一些除了业务之外的一些稍微具有一些挑战的工作。比如,做性能优化分析,写一个内部使用的框架,做一个小工具等。
- 每一个工程师应该以写能写出开源水平的框架为目标。这句话第二次深深的打动了我,让我重新找到了我做为技术工作者的奋斗目标。
为什么数据结构和算法经常放在一起来提?
- “算法不能离开数据结构单独存在”,以前也发现过这个问题,但是自己没深入想过。看到这句话的时候我一下子明白了(之所以我喜欢看这套教程的原因之一是,经常会让我有豁然开朗的感觉,哈哈)。数据结构是一种静态的结构描述,而算法是建筑在之上的动态的行为描述。可以使用两个例子来进行类比:一是设计模式中,有些模式是结构型模式,有些是行为型模式。另外一个例子是,一个社群环境下会有一个制度体系,这个制度体系就是静态的结构,也叫做规章制度。在此前提下,社群内的个体会在这个结构约束下产生一定的行为。
学习最常用的DS和ALG
- 常用的DS包括:数组,列表,stack, queue, hashmap, 二叉树,堆,跳表,图,trie树
- 常用的算法包括:递归,排序,二分查找,搜索,哈希算法,贪心,分治,回溯,动态规划,字符串匹配
复杂度分析法
分类
- 时间复杂度
- 空间复杂度
为什么使用要使用复杂度分析?
也可以才用事后分析,但事后统计分析:
- 依赖测试环境和测试数据
- 存在滞后性
使用复杂度分析比较快速简单,且在事前就可以进行定性的分析。事后分析更多是一种定量的分析方法,二者互补。
表示方法
使用大O表示法,有几个原因。 取量级最的来表示,如:一块代码的执行次数是n + n2 + 常量,那么整个复杂度就是O(n2)
Log底数不需要写,因为可以互相转换。log2 N可以转换成log3 M,所以通常写成O(logN)就可以了
时间复杂度的一些实用方法
- 只关注循环最多的一段代码
- 乘法法则。例子:当出现一个复杂度为O(logN)的子方法被n次调用时,那么这段代码的整体复杂度是O(NlogN)
常见的时间复杂度及优先级
O(1) > O(logN) > O(N) > O(N+M) > O(NlogN) > O(N2) > O(N3)
常见的空间复杂度
O(1), O(N), O(N2)
时间复杂度的分类
- 最好
- 最坏
- 平均,把每种情况的执行次数写上,除以所有可能情况数
- 均摊,当有规律的出现多次低复杂度+1次高复杂度的时候,可以近似的认为这次高复杂度的执行被均摊掉了,所以整体的复杂度还是为低复杂度。
那为什么时间复杂度有这么多种分类呢?原因很简单,因为有的算法在不同的数据集写,复杂度是不一样的。为了准确全面的评估这段代码的执行情况,需要所有情况都要考虑到。