数组取首末元素没有性能差距

一、简述

平时的业务开发中会经常出现数组(Array)一把梭的情况,大多数情况下都会用数组的形式进行操作,而有读源码习惯的开发者可能会发现,在一些底层库中,可能平时用数组的地方,底层库却选择了另外的数据结构,这是为什么?

二、什么是数组

数组是计算机科学中最基本的数据结构了,绝大多数编程语言都内置了这种数据结构,也是开发者最常见的数据结构。

数组是由相同类型的元素(element)的集合所组成的数据结构,分配一块连续的内存来存储。当然,在一些动态语言中例如 Python 的列表或者 JavaScript 的数组都可能是非连续性的内存,也可以存储不同类型的元素。如数组:arr = [1, 2, 3, 4, 5]。其在内存中的存储如图:

可以看到,这个数组在内存中是以连续线性的形式储存的。这个连续线性的储存形式既有其优势又有其劣势,只有搞清楚优劣才能在开发中更好地使用数组。

三、数组的特性

一个数据结构通常都有「插入、查找、删除、读取」这四种基本的操作。这里会逐一分析这些操作带来的性能差异。这里的性能并不是绝对意义上速度的快慢,因为不同的设备其硬件基础就会产生巨大的速度差异,这里的性能是在算法分析中的「复杂度」概念。

1️⃣插入性能

数组是一段连续储存的内存,当要将新元素插入到数组 k 的位置时,需要将 k 索引处之后的所有元素往后挪一位,并将 k 索引的位置插入新元素。

这个工作量相当大,通常情况下,插入操作的时间复杂度是 O(n)。

2️⃣删除性能

删除操作其实与插入很类似。假设删除数组之内的 k 索引位置的元素,在将其删除后,为了保持内存的连续性,需要将 k 之后的元素通通向前移动一位,这个情况的时间复杂度也是 O(n)。

3️⃣查找性能

比如查找某数组中是否存在一个为 2 的元素,计算机如何操作?计算机是从索引 0 开始往下匹配,直到匹配到 2 的元素为止。

这个查找的过程其实就是常见的线性查找,这个时候需要匹配的平均步数与数组的长度 n 有关,这个时间复杂度同样是 O(n)。

4️⃣读取性能

基于数组的特点拥有相同的数据类型和一块连续的线性内存,数组的读取性能非常的卓越,时间复杂度为 O(1),相比于链表二叉树等数据结构,它的优势非常明显。

那么数组是如何做到这么低的时间复杂度呢?假设数组内存起始地址为 start,而元素类型的长度为 size,数组索引为 i,那么很容易得到这个数组内存地址的寻址公式:arr[i]_address = start + size * i。比如要读取 arr[3] 的值,那么只需要把 3 代入寻址公式,计算机就可以一步查询到对应的元素,因此数组读取的时间复杂度只有 O(1)。

四、性能优化

数组操作,除「读取」外,其他「插入、查找、删除」的时间复杂度都在 O(n),那么如何进行性能优化呢?

1️⃣查找性能优化

当数组的元素是无序状态下,只能用相对不太快的线性查找进行查找。当元素是有序状态(递增或者递减),可以用另一种更高效的方法-----二分查找。

假设有一个 int[],以递增的方式储存:arr = [1, 2, 3, 4, 5, 6, 7]

如果要查找值为 6 元素,按照线性查找的方式需要根据数组索引从 0 开始依次比对,直到碰到索引 5 的元素。而二分查找的效率则更高,由于知道此数组的元素是有序递增排列的:可以取一个索引为 3 的元素为中间值 p,将 p 与目标值 6 进行对比,发现 p 的值 4<6,那么此时由于是递增数组,目标值一定在索引 3 之后的元素中。此时,再在索引 3 之后到尾部的元素中取出新的中间值 p 与目标值比对,再重复下去,直到找到目标值。可以发现这样的操作每一次对比都能排除当前元素数量一半的元素,整体下来的时间复杂度只有 O(log n),这表示此方法的效率极高。

这种高效的方法在数据量越大的情况下,越能体现出来。比如目前有一个 10 亿成员的数组是有序递增,如果按照线性查找,最差的情况下需要 10 亿此查找操作才能找到结果,而二分查找仅仅需要 7 次。

2️⃣插入性能优化

比如有以下数组,要将一个新成员 orange 插入索引 1 的位置,通常情况下需要后三位成员后移,orange 占据索引 1 的位置。但是需求不要求索引的有序性呢?也就是说,可以把数组当成一个集合概念,在索引 1 的位置插入 orange,并在数组的尾部开辟一个新内存将原本在 1 位置的 banana 存入新内存中,这样虽然索引乱了,但是整个操作仅仅需要 O(1) 的时间复杂度。

arr = ['apple','banana','grape','watermelon']

3️⃣删除性能优化

删除操作需要将删除位置后的元素集体向前移动,这非常消耗性能,尤其是在频繁的删除、插入操作中更是如此。可以先记录下相关的操作,但是并不立即进行删除,当到一定的节点时再一次性依据记录对数组进行操作,这样数组成员的反复频繁移动变成了一次性操作,可以很大程度上提高性能。

这个思想应用非常广泛:

1️⃣前端框架的虚拟 DOM 就是将对 DOM 的大量操作先储存在差异队列中,然后再一次性更新,避免了 DOM 的回流和重绘。
2️⃣V8 和 JVM 中的标记清除算法也是基于此思想,标记清除算法分为两个阶段,标记阶段对访问到的对象都打上一个标识,在清除阶段发现某个对象没有标记则进行回收。

五、小结

数组取首末元素有性能差距吗?显然没有,因为数组是一块线性连续的内存,可以通过寻址公式一步取出对应的成员,这跟成员的位置没有关系。

数组中的子元素问题,什么方法可以尽可能地降低时间复杂度?比如:给定一个整数数组,计算长度为 'k' 的连续子数组的最大总和。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,233评论 6 495
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,357评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,831评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,313评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,417评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,470评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,482评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,265评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,708评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,997评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,176评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,503评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,150评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,391评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,034评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,063评论 2 352

推荐阅读更多精彩内容