线性表:数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。有数组、链表、队列、栈等 非线性表:二叉树、堆、图等。
数组和链表的区别:链表适合插入、删除,时间复杂度为O(1),随机访问的时间复杂度是O(n)。数组适合查找,因为数组支持随机访问,根据下标随机访问查找的时间复杂度为O(1),插入删除时间复杂度是O(n)
数组是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。
数组适合查找,不是因为查找的时间复杂度是O(1),排好序的数组用二分查找时间复杂度是0(logn)。正确的是因为数组支持随机访问,根据下标随机访问的时间复杂度是O(1)。
数组的插入/删除:最好是在末尾插入/删除,时间复杂度O(1),最坏是在开头插入/删除,时间复杂度是O(n),平均情况时间复杂度O(n)。
警惕数组的访问越界问题。
容器和数组的区别和使用技巧:
1、Java ArrayList无法存储基本类型,比如int、long,需要封装为Integer、Long类,而Autoboxing、Unboxing则有一定的性能消耗,所以如果特别关注性能或者希望使用基本类型,就可以选用数组。
2、如果数组大小事先已知,并且对数据的操作非常简单,用不到ArrayList提供的大部分方法,也可以直接使用数组
3、要表示多维数组的时候,用数组会更加直观。
总结:对于业务开发,直接使用容器就足够了,省时省力。毕竟损耗一点点性能,完全不会影响系统整体的性能。如果要做一些非常底层的开发,性能需要做到极致优化,就可以采用数组。
链表:最经典的链表应用场景:LRU缓存淘汰算法
缓存:一种提高数据读取性能的技术,在硬件设计、软件开发中都有广泛的应用,比如常见的CPU缓存、数据库缓存、浏览器缓存。缓存大小有限,所以需要缓存淘汰策略,常见的缓存策略分为三种:先进先出策略FIFO(First In First Out)、最少使用策略LFU(Least Frequently Used)、最近最少使用策略LRU(Least Recently Used)
链表:不需要一块连续的内存空间,可以通过‘指针’将一组零散的内存块串联起来使用。常见的三种链表机构:单链表、双向链表、循环链表
链表插入和删除操作,只需要考虑相邻结点的指针改变,对应的时间复杂度为O(1)。
循环链表:特殊的单链表,单链表的尾结点指针指向空地址,循环链表的尾结点指针指向链表的头结点。比如约瑟夫问题
双向链表有一个前驱结点和一个后继结点
双向链表和单链表的复杂度是O(1),双向链表和单链表的比较:双向链表虽然比单链表费内存。
从链表中删除一个数据无外乎这两种情况:1、删除结点中“值等于某个给定值”的结点;2、删除给定指针指向的结点。
1、尽管单独的删除操作是O(1),但是遍历查找的复杂度是O(n),所以总复杂度就是O(n)。 2、单链表不支持直接获取前驱结点,为了找到前驱结点,还需要从头遍历链表,找到前驱结点,删除就需要O(n)、而双向链表中结点已经保存了前驱结点,不需要再遍历,所以为O(1)。
数组简单易用,在实现上使用的是连续的内存空间,可以借助 CPU 的缓存机制,预读数组中的数据,所以访问效率更高。而链表在内存中并不是连续存储,所以对 CPU 缓存不友好,没办法有效预读
数组的缺点是大小固定,需要占用整块连续的内存空间,如果声明的数组过大,系统可能没有足够的连续内存空间分配,导致内存不足。如果声明的太小,会出现不够用的情况,需要申请一个更大的内存空间,把原数组拷贝进去,非常费时。链表本身没有大小限制,天然支持动态扩容。
如果你的代码对内存的使用非常苛刻,数组更适合,链表需要额外的存储空间去存储一份指向下一个结点的指针,所以内存消耗会翻倍。而且,对链表进行频繁的插入、删除操作,还会导致频繁的内存申请和释放,容易造成内存碎片。