2.1 了解数组

什么是数组

数组是一种编程语言中的数据类型,还是一种最基础的数据结构。

数组如何实现随机访问

  1. 数组是一种线性表数据结构,用一组连续的内存空间存储相同类型的数据

线性表:数据、链表、队列、栈
非线性表:图、树

数组随机访问寻址公式:

a[i]_address = base_address + i * data_type_size

得益于连续的内存空间和相同的数据类型,所以数组可以随机访问。但是对数组进行删除、插入操作时,需要进行大量的数据搬移工作。

ps: 链表适合插入、删除、时间复杂度O(1);数组支持随机访问,根据下标随机访问的时间复杂度为O(1)。即使是排序号的数组,进行二分查找,时间复杂度也是O(logn)。

低效的插入和删除

插入: 最好O(1) ,最坏O(n), 平均O(n)

特殊情况 数组无序时,直接把被插入位置的原数据k,移动到数组元素的最后,再把新数据放入对应位置。

删除: 最好O(1),最坏O(n),平均O(n)

特殊情况 不进行删除搬移,仅进行标记,当数组没有更多的空间时再触发真正的删除操作。

警惕数组的访问越界问题

在c语言中,只要不是访问受限的内存都可以自由访问。函数体内的局部变量存在栈上,且是连续压栈。在linux进程的内存布局中,栈区在高地址空间,从高向低增长。变量i和arr在相邻地址,且i比arr的地址大,所以arr越界1位的话正好访问到i。同时i和arr元素正好同类型,i被覆盖成0,所以无限循环。

容器和数组

ArrayList最大的优势就是可以将很多数组操作的细节封装起来。如数组插入、删除时需要搬移其他数据等,支持动态扩容(空间不足时自动扩容为1.5倍)。
注意动态扩容比较耗时,建议在创建时实现指定数据大小
ArrayList无法存储基本类型,需要封装。
关注性能或者需要基本类型的前提下使用数组。

为什么数组从0开始

“下标”准确来说应该称为“偏移offset”。
如果用a标识首地址,a[0]就是偏移为0的地址,a[k]标识偏移k个type_size。

a[k]_address = base_address + k * type_size

如果从1开始

a[k]_address = base_address + (k-1)* type_size

不过最主要的可能是沿用了c语言的设计,用0开始计数数组下标。

此文章为2月Day1学习笔记,内容来源与极客时间《数据结构与算法之美》

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容