数据结构是计算机存储、组织数据的方式,同时也泛指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的算法执行或者数据存储效率。数据结构往往同高效的算法和索引技术有很强的关联性和依赖性。
在计算机程序设计中,我们可以用数据结构来表示特定的对象数据,这些数据往往是多样化的且拥有不同的数据结构,诸如数组、接口、类和枚举等等。不同的数据结构所采用的处理方法不同,计算复杂度也不同,因此,算法往往依赖于某种数据结构,即数据结构是算法实现的基础。难怪计算机科学家尼古拉斯·沃斯(Nicklaus Wirth)提出了著名公式“ 算法 + 数据结构 = 程序 ”,化繁为简地展示出了计算机程序的本质。对初学者来讲,仅仅依靠观察这个公式,我们也会发现数据结构和算法一定是如影相随难分难舍的。
1、数据结构定义
随着计算机科学与技术的飞速发展,计算机的应用领域已不再局限于科学计算,而更多地应用于控制、管理、生活和娱乐等非数值处理领域。与此相应,计算机程序处理的数据也由纯粹的数值扩充到字符、表格、图形、图表、图象、声音、位置等等,且数据量也越来越大,数据处理频次也越来越高。
由此可见,数据结构起源于计算机程序设计,并随之发展而发展,它们互为伴生物。虽然当下各种计算机以及程序已是家喻户晓触手可用,但遗憾的是,迄今为止,数据结构在业界还没有一个统一的定义,不同的专家,对数据结构有不同的阐述,以下便是几种典型的定义。
美国佛罗里达大学的计算机信息科学与工程杰出教授Sartaj Sahni在其经典著作《数据结构、算法和应用》中说:“数据结构是数据对象、存在于该对象的实例以及组成实例的数据元素之间的各种关系,并且这种关系可以通过定义相关的函数来给出。”
“数据结构是抽象数据类型ADT的物理实现。”这是美国弗吉尼亚理工大学计算机科学系教授Clifford A.Shaffer在其《数据结构与算法分析》一书中的定义。ADT,英文全称Abstract Data Type,意为抽象数据类型。此概念在后续章节详述。
Lobert L.Kruse在《数据结构与程序设计》一书中将一个数据结构的设计过程分成抽象层、数据结构层和实现层。其中,抽象层是指抽象数据类型层,即ADT层,它讨论数据的逻辑结构及其运算,数据结构层讨论一个数据结构的表示,实现层讨论数据结构在计算机内的存储细节以及运算的实现。
虽然没有一个统一的定义,未来可能也不会有统一的定义,毕竟仁者见仁智者见智,但是定义谓何不是我们真正关注的目标。此处,我们只需要领会贯通其基本含义,构建基本的与此相关的概念知识系统,未来能够用其灵活解决实际场景中的问题即可。因此,我们根据专家们的不同阐述,重点关注如下三点:数据的逻辑结构,数据的物理存储,数据的运算。
另外,数据结构不但是一切算法的基础,而且还是程序设计语言的基础。诸如Java,C++,C,C#,Python等等,其语言特性都是建立在一定的数据结构之上。因此,深入学习数据结构,也是掌握语言特性并能够高效解决实际程序设计问题的正确开始。
2、数据结构的基本概念
数据(Data)
数据元素(Data Element)
数据结构(Data Structure)
3、数据结构的内容
数据的逻辑结构
数据的存储结构
数据的运算
4、数据结构的分类
- 线性结构
数组、队列、链表、栈
- 非线性结构
树、图、堆、散列表
5、数据结构的存储方式
顺序存储方式
链接存储方式
索引存储方式
散列存储方式
6、数据类型
每种程序设计语言都有自己的数据类型。简单来说,数据类型就是值的集合,以及在值上定义的一系列操作的总称。比如,Java语言中的字节类型byte
,其范围是 -128 ~ 127 ,长度为1字节(8bit),我们可以对其进行加法、减法、乘法、除法和取模等操作。
6.1、基本数据类型
其值不可分解,是程序设计语言自身定义的一些数据类型。比如,Java语言中有8种基本类型:byte
,short
,int
,long
,float
,double
,char
,boolean
。
6.2、聚合数据类型
其值可以进一步分解为若干分量,一般是由用户自定义的数据类型。比如,Java语言中的数组
、类
和接口
等。
6.3、抽象数据类型
抽象数据类型(Abstract Data Type,ADT)描述了数据的逻辑结构以及在此结构上定义的操作。形式定义如下:
ADT 抽象数据类型名
{
数据对象:(数据元素集合)
数据关系:(数据关系二元组结合)
基本操作:(操作函数的罗列)
} ADT 抽象数据类型名;
抽象数据类型ADT一般具有两个重要特征:
数据抽象
关注实体的本质性特征,应具备的功能,以及针对外部用户的接口。数据封装
实体的外部特性和内部实现细节分离,且对外部用户隐藏其内部实现细节。
抽象数据类型ADT是描述问题的模型,它独立于具体实现,并且把数据和操作封装在一起,使得用户程序只能通过在ADT中定义的某些操作来访问其中的数据,从而实现信息的隐藏。
在Java语言中,使用接口来表示抽象数据类型ADT,用接口实现类来实现ADT。比如List接口和其实现类ArrayList 与 LinkedList 。
如此设计,很好地体现了程序设计中的两层抽象思想。ADT是概念上的抽象,而接口则属于实现层上的抽象。
7、常用数据结构
7.1、数组(Array)
数组是一种特殊的聚合数据类型,是将具有相同类型的若干变量有序地组织在一起的集合。数据是最基本的数据结构,在各种编程语言中都自带该类型。一个数组可以被分解为多个数组元素,按照数据元素的类型,数组又被分为整型数组、字符数组、字节数组、对象数组等等。数组还可以有一维数组、二维及多维等表现形式。
7.2、队列(Queue)
队列是一种特殊的线性表。队列只允许在表的一端进行插入操作,而在另一端进行删除操作。一般来说,进行插入操作的一端成为队尾,进行删除操作的一端成为队头。队列中没有元素时,被称为空队列。
7.3、链表(Linked List)
链接是一种数据元素按照链式存储结构进行存储的数据结构,这种结构在物理上具有非连续的特点。链表是有一系列数据结点构成,每个数据结点包括数据域和引用域两部分。其中,引用域保存了数据结构中下一个元素存放的地址。链接结构中数据元素的逻辑顺序是通过链表中的引用链接次序实现的。
7.4、栈(Stack)
栈是一种特殊的线性表,只能在表的一个固定端进行数据元素的插入和删除操作。栈按照后进先出的原则来存储数据,也就是说,先插入的数据被压入栈底,最后插入的数据在栈顶,读出数据时,从栈顶开式逐个读出。栈在汇编语言程序中经常用于重要数据的现场保护。栈中没有数据时,成为空栈。
7.5、树(Tree)
树是典型的非线性结构,它是包括n个结点的有穷集合K。在树结构中,有且只有一个根节点,该结点没有前驱结点。在树结构中的其它结点都有且仅有一个前驱结点,而且可以有m个后继结点,m >= 0。
7.6、堆(Heap)
堆是一种特殊的树形数据结构。一般讨论的堆都是二叉堆。堆的特点是其根节点的值是所有结点中最大的或者最小的,并且根节点的两个子树也是一个堆结构。
7.7、图(Graph)
图是另外一种非线性数据结构。在图结构中,数据结点一般称为顶点,而边是顶点的有序偶对。如果两个顶点之间存在一条边,那么这就表示这两个顶点有相邻关系。
7.8、散列表(Hash)
散列表源于散列函数(Hash Function),其思想是如果在结构中存在关键字和T相等的记录,那么必定在F(T)的存储位置可以找到该记录,这样就不用进行比较而直接取得所查记录。
8、计算问题
计算机能处理的问题包括:
数值计算问题
非数值计算问题
参考地址: