前言
上一章我们简单的介绍了数据结构的逻辑结构和存储结构,简单的回顾就是:
数据结构分为:
- 逻辑结构
- 集合结构
- 线性结构
- 树形结构
- 图结构
- 存储结构
- 顺序存储结构
- 链式存储结构
- 索引存储结构
- 散列存储结构
数据的逻辑结构其实还可以简单的分类为:
- 集合
数据结构中的元素之间除了“同属一个集合” 的相互关系外,别无其他关系
- 线性结构
数据结构中的元素存在一对一的相互关系
1、线性结构是非空集
2、线性结构有且仅有一个开始结点和一个终端结点
3、线性结构所有结点都最多只有一个直接前趋结点和一个直接后继结点
- 非线性结构
非线性结构就是表中各个结点之间具有多个对应关系.
1、非线性结构是非空集
2、非线性结构的一个结点可能有多个直接前趋结点和多个直接后继结点
逻辑结构分类图
常用数据结构简介
本章,我们简单的介绍下常用的数据结构,后续我们会对每一种结构展开来讲
线性表
线性表是最基本、最简单、也是最常用的一种数据结构。一个线性表是
n个具有相同特性的数据元素的有限序列。
线性表中数据元素之间的关系是一对一的关系,即除了第一个和最后一个数据元素之外,其它数据元素都是首尾相接的(注意,这句话只适用大部分线性表,而不是全部。比如,循环链表逻辑层次上也是一种线性表(存储层次上属于链式存储,但是把最后一个数据元素的尾指针指向了首位结点)。
栈
栈是一种特殊的线性表,仅能在线性表的一端操作,栈顶允许操作,栈底不允许操作。 栈的特点是:先进后出,或者说是后进先出,从栈顶放入元素的操作叫入栈,取出元素叫出栈。
如下图,你可以把这种结构想像成一个没有盖子的容器,依次装入1,2,3,4,5件物品,想取出的时候只能5,4,3,2,1这种顺序取出,而不能直接取任意的物品!
队列
队列与栈一样,也是一种线性表,不同的是,队列可以在一端添加元素,在另一端取出元素,也就是:先进先出。从一端放入元素的操作称为入队,取出元素为出队.
如图(我们从队尾插入数据,从队头取出数据)
数组(一维)
数组是可以在内存中连续存储多个元素的结构,在内存中的分配也是连续的,数组中的元素通过数组下标进行访问,数组下标从0开始。
例如下面这段代码就是将数组的第一个元素赋值为 1:
int[] data = new int[100];
data[0] = 1;
优点:
- 按照索引查询元素速度快
- 按照索引遍历数组方便
缺点:
- 数组的大小固定后就无法扩容了
- 数组只能存储一种类型的数据
- 添加,删除的操作慢,因为要移动其他的元素。
适用场景:
频繁查询,对存储空间要求不大,很少增加和删除的情况。
串
串(String)是由零个或多个字符组成的有限序列,又名字符串
串的逻辑结构和线性表极为相似,区别在于串的数据对象约束为字符集。然而基本操作有很大区别。在线性表的基本操作中,大多以“单个元素”作为操作对象;而串中,通常以“串的整体”为操作对象。
链表
链表是物理存储单元上非连续的、非顺序的存储结构,数据元素的逻辑顺序是通过链表的指针地址实现,每个元素(节点)包含两个区域,一个是存储元素的数据域 (内存空间),另一个是指向下一个结点地址的指针域。根据指针的指向,链表能形成不同的结构,例如单链表,双向链表,循环链表等。
单链表举例:
如图,单链表分有无头节点两种情况;
无头节点,头指针直接指向第一个节点;
有头节点,头指针指向头节点,头节点的指针域指向第一个节点;
需要注意的是,单链表可以没有头节点,但是必须要有头指针;
头指针的数据域可以为null,或者用来存放链表的长度等信息;
双向链表举例:
双向链表在单链表的基础上加上了一个指针域用来指向节点的上一个元素
循环链表举例:
循环链表在单链表的基础上,尾节点的指针指向了头节点
树
树是一种数据结构,它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做 “树” 是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:
每个节点有零个或多个子节点;
没有父节点的节点称为根节点;
每一个非根节点有且只有一个父节点;
-
除了根节点外,每个子节点可以分为多个不相交的子树;
在日常的应用中,我们讨论和用的更多的是树的其中一种结构,就是二叉树。
二叉树是树的特殊一种,具有如下特点: 每个结点最多有两颗子树,结点的度最大为2。
左子树和右子树是有顺序的,次序不能颠倒。
即使某结点只有一个子树,也要区分左右子树。
二叉树是一种比较有用的折中方案,它添加,删除元素都很快,并且在查找方面也有很多的算法优化,所以,二叉树既有链表的好处,也有数组的好处,是两者的优化方案,在处理大批量的动态数据方面非常有用。
扩展:
二叉树有很多扩展的数据结构,包括平衡二叉树、红黑树、B+树等,这些数据结构二叉树的基础上衍生了很多的功能,在实际应用中广泛用到,例如mysql的数据库索引结构用的就是B+树,还有HashMap的底层源码中用到了红黑树。这些二叉树的功能强大,但算法上比较复杂,想学习的话还是需要花时间去深入的。
散列表
散列表,也叫哈希表,是根据关键码和值 (key和value) 直接进行访问的数据结构,通过key和value来映射到集合中的一个位置,这样就可以很快找到集合中的对应元素。
记录的存储位置=f(key)
这里的对应关系 f 成为散列函数,又称为哈希 (hash函数),而散列表就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数组空间里,这种存储空间可以充分利用数组的查找优势来查找元素,所以查找的速度很快。
哈希表在应用中也是比较常见的,就如Java中有些集合类就是借鉴了哈希原理构造的,例如HashMap,HashTable等,利用hash表的优势,对于集合的查找元素时非常方便的,然而,因为哈希表是基于数组衍生的数据结构,在添加删除元素方面是比较慢的,所以很多时候需要用到一种数组链表来做,也就是拉链法。拉链法是数组结合链表的一种结构,较早前的hashMap底层的存储就是采用这种结构,直到jdk1.8之后才换成了数组加红黑树的结构,其示例图如下:
从图中可以看出,左边很明显是个数组,数组的每个成员包括一个指针,指向一个链表的头,当然这个链表可能为空,也可能元素很多。我们根据元素的一些特征把元素分配到不同的链表中去,也是根据这些特征,找到正确的链表,再从链表中找出这个元素。
哈希表的应用场景很多,当然也有很多问题要考虑,比如哈希冲突的问题,如果处理的不好会浪费大量的时间,导致应用崩溃。
堆
堆是一种比较特殊的数据结构,可以被看做一棵树的数组对象,具有以下的性质:
堆中某个节点的值总是不大于或不小于其父节点的值;
堆总是一棵完全二叉树。
将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。
堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4…n/2),满足前者的表达式的成为小顶堆,满足后者表达式的为大顶堆,这两者的结构图可以用完全二叉树排列出来,示例图如下:
因为堆有序的特点,一般用来做数组中的排序,称为堆排序。
图
图是由结点的有穷集合V和边的集合E组成。其中,为了与树形结构加以区别,在图结构中常常将结点称为顶点,边是顶点的有序偶对,若两个顶点之间存在一条边,就表示这两个顶点具有相邻关系。
按照顶点指向的方向可分为无向图和有向图:
图是一种比较复杂的数据结构,在存储数据上有着比较复杂和高效的算法,分别有邻接矩阵 、邻接表、十字链表、邻接多重表、边集数组等存储结构,在之后的文章中我们再做进一步的介绍.