如需转载, 请咨询作者, 并且注明出处.
有任何问题, 可以关注我的微博: coderwhy, 或者添加我的微信: 372623326
可能你之前经常听说数据结构和算法, 但是不知道他们在讨论什么.
因为似乎我们学习编程的过程中, 没有必要了解这些, 我只是在学习基本的语法/高级语法/做出界面效果/实现复杂的逻辑.
数据结构和算法? 它是什么? 为什么它如此重要?
一. 什么是数据结构和算法?
数据结构和算法的概念还真不是那么好定义.
什么是数据结构?
- 官方定义: 并没有…
- 民间定义:
- “数据结构是数据对象,以及存在于该对象的实例和 组成实例的数据元素之间的各种联系。这些联系可以
通过定义相关的函数来给出。” --- 《数据结构、算法与应用》 - “数据结构是ADT(抽象数据类型 Abstract Data Type)的物理实现。” --- 《数据结构与算法分析》
- “数据结构(data structure)是计算机中存储、组织数据的方式。通常情况下,精心选择的数据结构可以 带来最优效率的算法。” ---中文维基百科
- “数据结构是数据对象,以及存在于该对象的实例和 组成实例的数据元素之间的各种联系。这些联系可以
- 从上面的定义, 我们可以发现数据结构和算法的关系非常的紧密
- 我们还是从自己的角度来认识数据结构吧:
- 在计算机中, 存储和组织数据的方式
- 我们知道, 计算机中数据量非常庞大, 如何以高效的方式组织和存储呢?
- 这就好比一个庞大的图书馆中存放了大量的书籍, 我们不仅仅要把书放进入, 还应该在合适的时候能够取出来
- 我们从摆放图书说起
-
如果是自己的书相对较少, 我们可以这样摆放
-
如果你有一家书店, 书的数量相对较多, 我们可以这样摆放
-
如果我们开了一个图书馆, 书的数量相当庞大, 我们可以这样摆放
-
- 图书摆放要使得两个相关操作方便实现:
- 操作1:新书怎么插入?
- 操作2: 怎么找到某本指定的书?
- 图书各种摆放方式:
- 方法1:随便放
- 操作1:哪里有空放哪里,一步到位!
- 操作2: 找某本书, 累死...
- 方法2:按照书名的拼音字母顺序排放
- 操作1: 新进一本《阿Q正传》, 按照字母顺序找到位置, 插入
- 操作2: 二分查找法
- 方法3: 把书架划分成几块区域, 按照类别存放, 类别中按照字母顺序
- 操作1: 先定类别,二分查找确定位置,移出空位
- 操作2: 先定类别,再二分查找
- 方法1:随便放
- 结论:
- 解决问题方法的效率, 根数据的组织方式有关
- 计算机中存储的数据量相对于图书馆的书籍来说数据量更大, 数据更加多
- 以什么样的方式, 来存储和组织我们的数据才能在使用数据时更加方便呢?
- 这就是数据结构需要考虑的问题
常见的数据结构
-
比较常见的数据结构
-
常见的数据结构较多, 每一种都有其对应的应用场景, 不同的数据结构的不同操作性能是不同的:
- 有的查询性能很快,有的插入速度很快,有的是插入头和尾速度很快
- 有的做范围查找很快,有的允许元素重复,有的不允许重复等等
- 在开发中如何选择,要根据具体的需求来选择
注意: 数据结构和语言无关, 基本常见的编程语言都有直接或者间接的使用上述常见的数据结构
-
为什么之前学习JavaScript没有接触过数据结构呢? 好像只见过数组.
- 单纯从客户程序员的角度, 我们并不需要过多的了解它们的实现细节.
- 但是简单的使用不能让我们更加灵活的使用它们. 了解真相, 你才能获得真正的自由.
什么是算法?
-
算法(Algorithm)的认识
- 在之前的学习中, 我们可能学习过几种排序算法. 并且知道, 不同的算法, 执行效率是不一样的.
- 也就是说进行某些操作的过程中, 不仅仅数据的存储方式会影响效率, 算法的优劣也会影响着效率
- 那么到底什么是算法呢?
-
算法的定义:
- 一个有限指令集, 每条指令的描述不依赖于语言
- 接受一些输入(有些情况下不需要输入)
- 产生输出
- 一定在有限步骤之后终止
-
算法通俗理解:
- Algorithm这个单词本意就是解决问题的办法/步骤逻辑.
- 数据结构的实现, 离不开算法.
-
举例: 电灯不工作的解决算法
二. 生活中的数据结构和算法
前面我们提了一下生活中的数据结构和算法: 图书的摆放.
为了更加方便的插入和搜索书籍, 需要合理的组织数据, 并且通过更加高效的算法插入和查询数据.
除了这些, 生活中还有很多案例.
数据结构的案例
- 快递员的快递
- 上大学期间不知道大家有没有收过快递.
- 大学的快递通常情况不是送到宿舍的(要不快递员不愿意挨着去送, 要不宿舍压根不让进), 通常快递会放在某个固定的地方, 让大家自己去拿.
- 当你跑到固定的地方拿快递, 还有两种情况: 一种自己去海量的快递中找, 另一种快递员让你报出名字, 它帮你找.
- 自己寻找相当于线性查找, 一个个挨着看吧. 当然我们人类眼睛处理数据的能力非常快, 眼观六路耳听八方, 可能很快也能找到.
- 但是比较好的方式, 应该是快递员帮我们找. 如果这个快递员动动脑筋的话, 最好的方式是对快递进行分类, 比如按照名字分类.
- 这个时候, 只要你报出名字, 它会根据姓氏立马锁定到一块快递中, 再根据名字马上帮你找到.
- 这就体现了合理的组织数据, 对于我们获取数据效率的重要性至关重要.
算法的案例
- 找出线缆出问题的地方:
- 假如上海和杭州之间有一条高架线, 高架线长度是1,000,000米, 有一天高架线中有其中一米出现了故障.
- 请你想出一种算法, 可以快速定位到处问题的地方.
- 线性查找:
- 从上海的起点开始一米一米的排查, 最终一定能找到出问题的线段.
- 但是如果线段在另一头, 我们需要排查1,000,000次. 这是最坏的情况. 平均需要500,000次.
- 二分查找:
- 从中间位置开始排查, 看一下问题出在上海到中间位置, 还是中间到杭州的位置.
- 查找对应的问题后, 再从中间位置分开, 重新锁定一般的路程.
- 最坏的情况, 需要多少次可以排查完呢? 最坏的情况是20次就可以找到出问题的地方.
- 怎么计算出来的呢?log(1000000, 2), 以2位底, 1000000的对数 ≈ 20.
- 结论:
- 你会发现, 解决问题的办法有很多. 但是好的算法对比于差的算法, 效率天壤之别.