程序 = 数据结构 + 算法
数据结构
计算机,见名知意,就是用于数值计算的机器,当然这是对于早期的计算机而言。
计算机的创建起源,就是源于人们需求庞大数学计算,此时人工进行计算已无法满足此类数据需求,急需一种能自动进行数值计算的工具,来帮助人们完成这类大型数据量的计算,这就是计算机。
计算机的面世,让人们摆脱了大量重复计算问题,但实践来自于生活,为了让计算机可以协助解决人们实际生活中的计算问题,就需要先将实际生活中的数据映射到计算机中,这样计算机才能进行操作,这就是一个数据建模过程。比如对于数值计算,建模的过程就是将真实数据映射为计算机的数值类型,这样计算机就能对这些数据进行计算,反馈于现实。
但是随着计算机的发展,它已不再仅仅只能用于数值计算,比如对于当代生活来讲,文本、图片、语音、视频等已成为日常不可或缺的信息数据,计算机同样能展示这些数据,当然同样需要映射为计算机能进行处理的某种数据类型。
随着展示内容的愈丰富,数据会愈加复杂,此时就需要一种结构,可以用来描述特定信息的数据关系,这种结构称为数据结构。
比如对于文本数据,映射到计算机中就是很多个字符类型(即char
)数据,各个字符间的关系就是按线性进行排序,因此计算机对这块内存进行操作,就相当于对文本进行操作。
综上,可以得出如下两个结论:
- 数据:就是对真实世界的数据的一个映射,是计算机可以进行操作的对象。
- 数据结构:就是对数据元素之间关系的一种描述。
数据是单独存在的,而数据结构,将多个独立的数据组织在一起,并且为各数据间赋予了特定的关系。
数据间的关系无外乎以下四种类型,他们对应的常用数据结构如下所示:
- 彼此独立:即数据元素除了同属一个集合外,它们之间没有任何关系。对应这种关系的数据结构为 集合。
- 一对一:即集合中的一个数据元素对应集合中的另一个数据元素。这种关系的典型数据结构为 线性表,比如数组,链表,栈和队列。
- 一对多:即一个数据元素与集合中其他多个数据元素有关系。这种关系的典型数据结构为 树。
- 多对多:即集合中的每个数据元素都可能与其他多个数据元素有关系。这种关系的典型数据结构为 图。
数据结构着重对数据元素之间关系的描述,这称为数据结构的逻辑结构;
但是数据结构同时是一个集合结构,负责组织数据元素,因此需要使用某种存储结构存储这些数据元素,这样才能对这些数据元素关系进行描述,这称为数据结构的物理结构。
简单来讲,数据结构的物理结构应当能正确反应数据元素之间的逻辑关系。
因此,以怎样的结构存储数据元素,就是数据结构的一个关键点。当前计算机(指内存)主要使用以下两种结构存储数据元素:
-
顺序存储结构:把数据元素放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
注:顺序存储结构在编程语言中的实现就是 数组。 -
链式存储结构:把数据元素存放在任意的存储单元里,所以数据之间的位置是分散的。此时数据存储完毕,但是数据间的逻辑关系没有建立,因此通过为每个数据元素增添一个指针指向下一个数据元素的地址,这样通过指针就可以找到下一个数据元素的位置,从而建立起联系。
注:链式存储结构在编程语言中的实现就是 链表。
逻辑结构是面向问题的,而物理结构是面向计算机的,其基本的目标就是将数据及其逻辑关系存储到计算机的内存中。
算法
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
简而言之,算法是描述解决问题的方法。
算法具有五个基本特性:
- 输入:算法具有零个或多个输入。输入提供已知条件。
- 输出:算法至少有一个或多个输出。输出返回处理结果。
- 有穷性:指算法执行步骤是有限的,不会产生死循环,且每个步骤都在可接受时间内完成。
- 确定性:相同的输入只能有唯一的相同的输出结果。
- 可行性:指每个步骤都能够通过执行有限次数完成。
算法设计应遵循以下几个要求:
- 正确性:指算法对输入的数据,能够得到正确的答案。
- 可读性:算法编写应当便于他人阅读、理解和交流。
- 健壮性:对不合法的输入数据做出合适的处理。
- 时间效率高和存储量低:指完成相同的操作,使用的时间更少,空间占用更低。
算法复杂度:
-
时间复杂度:指算法对数据规模
处理时间的一种度量方法。
时间复杂度并不是对算法时间的度量,而是对数据规模
的增加而导致的算法运行时间的增速,即时间复杂度是对 时间增速 的度量。
算法的时间复杂度常用大O表示法进行表示。
常见的时间复杂度排序如下:
-
空间复杂度:算法的空间复杂度通过计算算法所需的存储空间实现。
一般情况下,一个程序在机器上执行时,除了需要存储程序本身的指令,常数,变量和输入数据外,还需要存储对数据操作的存储单元。若输入数据所占空间只取决于问题本身,和算法无关,这样就只需要分析该算法在实现时所需的辅助单元即可。若算法执行时所需的辅助空间相对于输入数据量而言是个常数,则称此算法为原地工作,空间复杂度为
总结
软件编程(程序),个人理解,其本质就是对数据的操作。
编程语言的最小执行封装单位为 函数,对于任何函数而言,其都会有输入(参数)、输出(返回值)和函数体。
无论输入的内容是什么,它都表示为一种数据(信息),函数体对输入数据进行处理,然后返回给输出。
注:哪怕输入为空,也可以认为是一种数据,编程语言也明确给出了空对应的数据类型,比如void
、null
、None
...
输入为空,只是代表该输入数据不用也无法进行处理。
数据就是程序的源泉,没有数据,就相当于现代工业没有石油,整个体系会轰然崩溃。
唯有以数据进行驱动,程序才会彰显活力。
数据结构是对数据元素的关系描述,算法是解决问题的方法描述。
算法从一个维度上阐述了问题的解决思路,而程序本质是对数据的操作,因此,算法其实最终指导的是对数据的处理流程。
数据之间是彼此独立的,而算法是对一类问题的解决方法,这类问题中,数据之间必然存在某种联系,否则算法无法针对这类问题给出抽象统一解决方案。而数据之间的某种联系,可以使用相应的数据结构进行组织,这样就将数据结构与算法结合起来,最终完成程序编写。