2.1 了解数组

什么是数组

数组是一种编程语言中的数据类型，还是一种最基础的数据结构。

数组如何实现随机访问

数组是一种线性表数据结构,用一组连续的内存空间存储相同类型的数据。

线性表：数据、链表、队列、栈
非线性表：图、树

数组随机访问寻址公式：

a[i]_address = base_address + i * data_type_size

得益于连续的内存空间和相同的数据类型，所以数组可以随机访问。但是对数组进行删除、插入操作时，需要进行大量的数据搬移工作。

ps: 链表适合插入、删除、时间复杂度O(1);数组支持随机访问，根据下标随机访问的时间复杂度为O(1)。即使是排序号的数组，进行二分查找，时间复杂度也是O(logn)。

低效的插入和删除

插入：最好O(1) ,最坏O(n), 平均O(n)

特殊情况数组无序时，直接把被插入位置的原数据k，移动到数组元素的最后，再把新数据放入对应位置。

删除：最好O(1),最坏O(n),平均O(n)

特殊情况不进行删除搬移，仅进行标记，当数组没有更多的空间时再触发真正的删除操作。

警惕数组的访问越界问题

在c语言中，只要不是访问受限的内存都可以自由访问。函数体内的局部变量存在栈上，且是连续压栈。在linux进程的内存布局中，栈区在高地址空间，从高向低增长。变量i和arr在相邻地址，且i比arr的地址大，所以arr越界1位的话正好访问到i。同时i和arr元素正好同类型，i被覆盖成0，所以无限循环。

容器和数组

ArrayList最大的优势就是可以将很多数组操作的细节封装起来。如数组插入、删除时需要搬移其他数据等，支持动态扩容（空间不足时自动扩容为1.5倍）。
注意动态扩容比较耗时，建议在创建时实现指定数据大小。
ArrayList无法存储基本类型，需要封装。
关注性能或者需要基本类型的前提下使用数组。

为什么数组从0开始

“下标”准确来说应该称为“偏移offset”。
如果用a标识首地址，a[0]就是偏移为0的地址，a[k]标识偏移k个type_size。

a[k]_address = base_address + k * type_size

如果从1开始

a[k]_address = base_address + (k-1)* type_size

不过最主要的可能是沿用了c语言的设计，用0开始计数数组下标。

此文章为2月Day1学习笔记，内容来源与极客时间《数据结构与算法之美》