1. 实验介绍
1.1. 实验目的
本实验主要介绍数据结构基本类型、特点与基本表示方法。大家学习后可以了解数组,栈,链表,队列,树,图,堆,散列表等的概念及其表示。
1.2. 知识点
数组
栈
链表
队列
树
图
堆
散列表
2. 数据结构分类
数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。
常用的数据结构有:数组,栈,链表,队列,树,图,堆,散列表等。
如图所示:
每一种数据结构都有着独特的数据存储方式,下面为大家介绍它们的结构和优缺点。
3. 数组结构概述
数组是可以再内存中连续存储多个元素的结构,在内存中的分配也是连续的。数组中的元素通过数组下标进行访问,数组下标从0开始。
例如下面这段代码就是将数组的第一个元素赋值为 1。
int[] data = new int[100]; data[0] = 1;
优点:
按照索引查询元素速度快 ;
按照索引遍历数组方便。
缺点:
数组的大小固定后就无法扩容了;
数组只能存储一种类型的数据 ;
添加,删除的操作慢,因为要移动其他的元素。
适用场景:
频繁查询,对存储空间要求不大,很少增加和删除的情况。
4. 栈结构概述
栈是一种特殊的线性表,仅能在线性表的一端操作,栈顶允许操作,栈底不允许操作。
栈的特点是先进后出,或者说是 “后进先出”,从栈顶放入元素的操作叫入栈,取出元素叫出栈。
如下图所示:
栈的结构就像一个集装箱,越先放进去的东西越晚才能拿出来,所以,栈常应用于实现递归功能方面的场景。
5. 队列结构概述
队列与栈一样,也是一种线性表。
队列可以在一端添加元素,在另一端取出元素,也就是 “先进先出”。从一端放入元素的操作称为入队,取出元素为出队。
示例图如下:
使用场景:因为队列先进先出的特点,在多线程阻塞队列管理中非常适用。
6. 链表结构概述
链表是物理存储单元上非连续的、非顺序的存储结构。
数据元素的逻辑顺序是通过链表的指针地址实现;
每个元素包含两个结点,一个是存储元素的数据域 (内存空间),另一个是指向下一个结点地址的指针域;
根据指针的指向,链表能形成不同的结构,例如单链表,双向链表,循环链表等。
链表的优点:
链表是很常用的一种数据结构,不需要初始化容量,可以任意加减元素;
添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址即可,所以添加,删除很快。
缺点:
因为含有大量的指针域,占用空间较大;
查找元素需要遍历链表来查找,非常耗时。
适用场景:
数据量较小,需要频繁增加,删除操作的场景。
7. 树结构概述
树是一种数据结构,它是由“n(n>=1)”个有限节点组成一个具有层次关系的集合。
把它叫做 “树” 是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
树具有以下的特点:
每个节点有零个或多个子节点;
没有父节点的节点称为根节点;
每一个非根节点有且只有一个父节点;
除了根节点外,每个子节点可以分为多个不相交的子树。
在日常的应用中,我们讨论和用的更多的是树的其中一种结构,就是二叉树,如下图所示。
二叉树是树的特殊一种,具有如下特点:
每个结点最多有两颗子树,结点的度最大为2。
左子树和右子树是有顺序的,次序不能颠倒。
即使某结点只有一个子树,也要区分左右子树。
二叉树是一种比较有用的折中方案。
二叉树添加,删除元素都很快,并且在查找方面也有很多的算法优化;
二叉树既有链表的好处,也有数组的好处,是两者的优化方案,在处理大批量的动态数据方面非常有用。
8. 散列表结构概述
散列表,也叫哈希表,是根据关键码和值 (key和value) 直接进行访问的数据结构。
通过key和value来映射到集合中的一个位置,这样就可以很快找到集合中的对应元素。
记录的 “存储位置=f(key) ” 。
这里的对应关系 f 成为散列函数,又称为哈希 (hash函数);
散列表就是把 "Key" 通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字;
该数字对数组长度进行取余,取余结果就当作数组的下标;
将value存储在以该数字为下标的数组空间里。
这种存储空间可以充分利用数组的查找优势来查找元素,所以查找的速度很快。散列表结构如下:
从图中可以看出,左边很明显是个数组,数组的每个成员包括一个指针,指向一个链表的头。
当然这个链表可能为空,也可能元素很多。
我们根据元素的一些特征把元素分配到不同的链表中去。
根据这些特征,找到正确的链表,再从链表中找出这个元素。
9. 堆结构概述
堆是一种比较特殊的数据结构,可以被看做一棵树的数组对象,具有以下的性质:
堆中某个节点的值总是不大于或不小于其父节点的值;
堆总是一棵完全二叉树。
将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆等。
堆的定义如下:
"n" 个元素的序列 "{k1,k2,ki,…,kn}" 当且仅当满足下关系时,称之为堆。
"(ki <= k2i,ki <= k2i+1)" 或者 "(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4…n/2)" ,满足前者的表达式的成为小顶堆,满足后者表达式的为大顶堆。
这两者的结构图可以用完全二叉树排列出来。
示例图如下:
10. 图结构概述
图是由结点的有穷集合 "V"和边的集合 "R"组成。
为了与树形结构加以区别,在图结构中常常将结点称为顶点,边是顶点的有序偶对,若两个顶点之间存在一条边,就表示这两个顶点具有相邻关系。
图结构如下所示:
图是一种比较复杂的数据结构,在存储数据上有着比较复杂和高效的算法,分别有邻接矩阵、邻接表、十字链表、邻接多重表、边集数组等存储结构。
这些内容,我们在图的进阶教程中给大家介绍。
11. 学习总结
经过本实验的学习,大家基本了解了数据结构的基本类型,包括组,栈,链表,队列,树,图,堆等。并且,学习了每种数据结构的特点与基本组成,对数据结构的理论介绍有了一定的了解,对数据结构不同的模式能够进行明确的定义与区分。
文字不够直观,我们在微信公众号上传了相关的实验视频,大家如果还没有理解透彻,可以关注我们的微信公众号观看视频。
想获取更多内容,请关注海数据公众号。
本期分享到这里,剩下的实验我们会持续更新,咱们下期再见,期待您的再次光临。有什么建议,比如想了解的知识、内容中的问题、想要的资料、下次分享的内容、学习遇到的问题等,请在下方留言。如果喜欢请关注。
0人点赞