5.数据结构和算法的关系
1.常见数据结构
数据结构其实逃离不了数据,数据结构发明的本身是为了更好的处理数据。其实,数据结构按照在内存里的分布总共分两类,线性和非线性。我们在非线性结构上处理数据,都是为了更好的达到我们想要的性能。
按在内存中是否是线性结构分:
- 线性结构:对应数组,下标访问O(1),排序最快O(nlogn),也有O(n).这是最直观的一个结构。
- 非线性结构:链表,树,图,其中,链表结构其实可以认为是树和图的基础结构,而图又是树结构的一个特例。
按不同的使用规则分:
- 栈,后进先出的规则,有一定顺序的,一般用线性结构实现。
- 队列,先进先出的规则,可以用线性结构实现,也可以用非线性结构实现。无论哪个结构,都需要保留两个标记,头,尾。头部负责出队列,尾部负责进队列。
- 堆,有一定规则的树结构,保证顶点是最大或者最小来称为大顶堆或者小顶堆。
- 图,抽象上比树结构多一些指向指针的结构,可以用部分线性部分非线性结构来组合表示,一般根据所需要表示图的特性来决定。
- 哈希表,这是一种线性表和链表结合的数据结构,意图在使用索引值快速的进行查找,一种用空间换时间的数据结构。
2.基本的数据结构算法
说到基础:我能想到的就两个,查找和排序。当然,不是说其他不是基础,只是我看来,这两个是很多问题的基础思路,并加以一定规律的扩展。
- 查找:
假定我们有N个线性结构的数据,我们要在N个数据中查找某个给定值。
常规的查找,我们要把整个数组走一遍,时间复杂度一般为O(N)
但是如果遇到特殊情况:
1.我们的数组是按一定规则(从小到大,从大到小,或者排好序的数组在某个节点旋转过一次且只有一次)的时候,我们可以用 二分查找 法来做,这会让平均的时间复杂度降为O(logN)
2.我们要查找的是数据中m个最大或者最小的元素,这个时候,我们可以借助堆结构。
对于非线性结构,比如说树,查找某个值,或者某几个节点的最大最小值,我们一般用动态规划或者分治(迭代实现)。
- 排序
常见排序算法的时间复杂度为O()和O(NlogN),当然也有一些高级的排序算法只要O(N)或O(N+K).例如python中给出的sort()用的是Timsort,时间复杂度为O(NlogN),兼用了二分插入排序和归并排序。
排序里的算法没有好坏,只有说在什么场合的使用。(具体排序算法,会在数据结构和算法里讲。)
其实我们想到的这两个算法是最基本的数据结构算法,高级的一些算法,能分治用动态规划的,只要找出那个基本公式使用迭代就可以解决,但是想不到的话,可能会麻烦点。寻找问题里的重复点,这是解决问题的一种思路,找意图,找到题目没有明说,但其实是存在的一种规律。这是题外话。
2.总结
不知道抛砖引玉说了那么多,是否点了重点。
其实重点是,我们要熟悉数据结构和算法的使用场合和分情况讨论。就像基础的排序算法,插入排序,数组和链表结构都可以实现,但是根据需要来选择用数组还是链表,根据需要来选择是用哪种排序方法。
很多时候,光看数据结构和算法本身,并不能加深我们对其的印象,需要联系实际中的一些情况来看,没有现成的,去发现和寻找,然后你会发现,发现和思索多了,你的思维就会跟上去了。
没有最好的,只有最适合的,有时候,我们选择了一种看似特别好的算法,可能会在某种特殊情况下性能下降很厉害,这种时候,我们就需要考虑这种特殊情况是否在我们的数据中出现的多,如果多,我们需要换一种可能不是最好,但是综合起来的性能还不错的算法。
毕竟很多时候,双刃剑就是,一个事物的优点,往往也是它的弱点,你不仅要清楚其优点所在环境,更要清楚其弱点产生的环境。这样在学习的时候会有所留意,日后用的时候也会权衡的得心应手。
给定的数据情况决定我们所采用的数据结构,具体要达成的目标和性能,决定我们采用的算法。当多种数据结构和算法可选择时,选择最合适的。也可以给不同的场景选择不同的。
以上就是我对算法入门的一些认识,深入部分尚为涉及,一点个人看算法的感受,抛砖引玉,个别深入细节,会另开章节。