数据结构的分类
数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成
简单来说:数据结构是以某种特定的布局方式存储数据的容器。这种“布局方式”决定了数据结构对于某些操作是高效的,而对于其他操作则是低效的。首先我们需要理解各种数据结构,才能在处理实际问题时选取最合适的数据结构。
常用的数据结构有:数组,栈,链表,队列,树,图,堆,散列表等
1、数组
数组是可以再内存中连续存储多个元素的结构,在内存中的分配也是连续的,数组中的元素通过数组下标进行访问,数组下标从0开始
NSArray *array = [NSArray arrayWithObjects:@"1",@"2",@"3",@"4", nil];
// NSArray *array = @[@"1",@"2",@"3",@"4"];
NSLog(@"%@",array[0]);
优点:
- 1、按照索引查询元素速度快
- 2、按照索引遍历数组方便
缺点:
- 1、数组的大小固定后就无法扩容了
- 2、数组只能存储一种类型的数据
- 3、添加,删除的操作慢,因为要移动其他的元素。
适用场景:
- 频繁查询,对存储空间要求不大,很少增加和删除的情况。
2、栈
栈是一种特殊的线性表
,仅能在线性表的一端操作,栈顶允许操作,栈底不允许操作。栈的特点是:先进后出,或者说是后进先出,从栈顶放入元素的操作叫入栈,取出元素叫出栈
线性表是最基本、最简单、也是最常用的一种数据结构。线性表(linear list)是数据结构的一种,一个线性表是n个具有相同特性的数据元素的有限序列。
线性表中数据元素之间的关系是一对一的关系,即除了第一个和最后一个数据元素之外,其它数据元素都是首尾相接的(注意,这句话只适用大部分线性表,而不是全部。比如,循环链表逻辑层次上也是一种线性表(存储层次上属于链式存储),但是把最后一个数据元素的尾指针指向了首位结点)
3、队列
队列与栈一样,也是一种线性表,不同的是,队列可以在一端添加元素,在另一端取出元素,也就是:先进先出。从一端放入元素的操作称为入队,取出元素为出队
4、链表
链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成。每个结点包括两个部分:一个是存储数据元素的数据域,另一个是存储下一个结点地址的指针域。 相比于线性表顺序结构,操作复杂。由于不必须按顺序存储,链表在插入的时候可以达到O(1)
的复杂度,比另一种线性表顺序表快得多,但是查找一个节点或者访问特定编号的节点则需要O(n)
的时间,而线性表和顺序表相应的时间复杂度分别是O(logn)和O(1)。
根据指针的指向,链表能形成不同的结构,例如单链表
,双向链表
,循环链表
等。
双向链表也叫双链表,是链表的一种,它的每个数据结点中都有两个指针,分别指向直接后继和直接前驱。所以,从双向链表中的任意一个结点开始,都可以很方便地访问它的前驱结点和后继结点。一般我们都构造双向循环链表。
链表的优点:
- 链表是很常用的一种数据结构,不需要初始化容量,可以任意加减元素;
- 添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址即可,所以添加,删除很快;
缺点:
- 因为含有大量的指针域,占用空间较大;
- 查找元素需要遍历链表来查找,非常耗时。
适用场景:
- 数据量较小,需要频繁增加,删除操作的场景
5、树
树是一种数据结构,它是由n(n>=1)
个有限节点组成一个具有层次关系的集合。把它叫做 “树” 是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:
- 每个节点有零个或多个子节点;
- 没有父节点的节点称为根节点;
- 每一个非根节点有且只有一个父节点;
- 除了根节点外,每个子节点可以分为多个不相交的子树;
在日常的应用中,我们讨论和用的更多的是树的其中一种结构,就是二叉树
。
二叉树是树的特殊一种,具有如下特点:
- 1、每个结点最多有两颗子树,结点的度最大为2。
- 2、左子树和右子树是有顺序的,次序不能颠倒。
- 3、即使某结点只有一个子树,也要区分左右子树。
二叉树是一种比较有用的折中方案,它添加,删除元素都很快,并且在查找方面也有很多的算法优化,所以,二叉树既有链表的好处,也有数组的好处,是两者的优化方案,在处理大批量的动态数据方面非常有用。
二叉树有很多扩展的数据结构,包括
平衡二叉树
、红黑树
、B+树
等,这些数据结构二叉树的基础上衍生了很多的功能,在实际应用中广泛用到,例如mysql
的数据库索引结构用的就是B+树
,还有HashMap
的底层源码中用到了红黑树
。这些二叉树的功能强大,但算法上比较复杂,想学习的话还是需要花时间去深入的。
6、散列表
散列表,也叫哈希表
,是根据关键码
和值 (key和value)
直接进行访问的数据结构,通过key
和value
来映射到集合中的一个位置,这样就可以很快找到集合中的对应元素。
记录的存储位置=f(key)
- 这里的对应关系
f
成为散列函数
,又称为哈希 (hash函数)
,而散列表就是把Key
通过一个固定的算法函数
既所谓的哈希函数
转换成一个整型数字
, - 然后就将该数字对数组长度进行
取余
,取余结果就当作数组的下标
- 将value存储在以该数字为下标的
数组空间里
- 这种存储空间可以充分利用数组的查找优势来查找元素,所以查找的速度很快。
哈希表在应用中也是比较常见的,就如Java
中有些集合类就是借鉴了哈希原理构造的,例如HashMap
,HashTable
等,利用hash表的优势,对于集合的查找元素时非常方便的,然而,因为哈希表是基于数组衍生的数据结构
,在添加删除元素方面是比较慢的,所以很多时候需要用到一种数组链表来做,也就是拉链法
。拉链法是数组结合链表的一种结构
,较早前的hashMap底层的存储就是采用这种结构,直到jdk1.8之后才换成了数组加红黑树的结构.iOS
中weak表(弱引用表)
就是典型的哈希表
- 左边很明显是个数组,数组的每个成员包括一个指针,指向一个链表的头,
- 当然这个链表可能为空,也可能元素很多。
- 我们根据元素的一些特征把元素分配到不同的链表中去,
- 也是根据这些特征,找到正确的链表,再从链表中找出这个元素。
哈希表的应用场景很多,当然也有很多问题要考虑,比如哈希冲突的问题,如果处理的不好会浪费大量的时间,导致应用崩溃。
7、堆
堆是一种比较特殊的数据结构,可以被看做一棵树的数组对象
,具有以下的性质:
- 堆中某个节点的值总是不大于或不小于其父节点的值;
- 堆总是一棵完全二叉树。
将根节点最大的堆叫做最大堆或大根堆
,根节点最小的堆叫做最小堆或小根堆
。常见的堆有二叉堆
、斐波那契堆
等。
堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4…n/2),
满足前者的表达式的成为小顶堆
,满足后者表达式的为大顶堆
,这两者的结构图可以用完全二叉树排列出来
8、图
图型结构也称图案
,指个体目标重复排列的空间形式。图案反映了地物的空间分布特征,它可以是自然的,也可以是人为构造的。 [1] 图形结构,简称“图”,是一种复杂的数据结构。图形结构中,每个结点的前驱结点数和后续结点数可以任意多个。
数据元素间的关系是任意的。其他数据结构(如树、线性表等)都有明确的条件限制,而图形结构中任意两个数据元素间均可相关联。常用来研究生产流程、施工计划、各种网络建设等问题。