计算机基础: 什么样的代码能让CPU运行的更快?

计算机基础: 什么样的代码能让CPU运行的更快?

众所周知,程序在计算机里运行时,程序的指令和数据存储在 内存 中。当程序进程获得CPU时间片时,CPU将会从 内存 中"恢复执行现场",然后继续循环执行程序的指令知道程序进程结束。

CPU的执行速度 与 内存的读写速度 不在同一个层级,通常一次内存访问需要 200~300 个时钟周期,而CPU一个时钟周期可以执行 3~9 条指令。而一个程序中,访问内存的指令通常占25%左右,如果不能以某种方式降低访问内存时延的话,那对CPU执行来说就是个灾难!

因此为了尽可能降低内存与CPU之间读写差异,CPU内部加入了 CPU Cache,也被称为高速缓存。它体积小但访问速度极快,根据数据局部性原则,常用的数据可以复制到 CPU Cache 从减少CPU对内存的访问。

CPU Cache 分为3层:L1, L2, L3。其中 L1 高速缓存的访问速度几乎与寄存器一样快,只需要 2~4 个时钟周期。L2 则为 10~20 个时钟周期,L3 则为 20~60 个时钟周期。

我们的代码只有让 CPU Cache 更多命中缓存,减少CPU直接从内存中读取数据,这样才能让CPU跑得更快!

  • CPU Cache 是如何存储数据的?

CPU Cache 是由很多个连续的内存块组成,每个内存块被称为 Cache LineCache Line 的数量是限定的,例如在一个64KB的 CPU Cache 中, 如果 Cache Line 的大小为 64字节, 那么就只有 1024 条Cache Line

常见的 CPU Line 大小为 3264128 字节。这是一个经验值,如果 CPU Line 过大,局部性空间也越大,但是对应缓存行数就会越少。

  • CPU Line 是如何被替换的?

通常有 LRU 最近最少使用策略随机替换策略 两种。

当CPU访问新数据且未命中 CPU Cache 时,那么则需要选择一条 CPU Line 来被新数据替换

  • 如何查看 CPU CacheCPU Line 的大小?
# 查看 L1 Cache 「数据」缓存的容量大小
cat /sys/devices/system/cpu/cpu0/cache/index0/size

# 查看 L1 Cache 「指令」缓存的容量大小
cat /sys/devices/system/cpu/cpu0/cache/index1/size

# 查看 L2 Cache 的容量大小
cat /sys/devices/system/cpu/cpu0/cache/index1/size

# 查看 L3 Cache 的容量大小
cat /sys/devices/system/cpu/cpu0/cache/index1/size

# 查看 Cache Line 的容量大小 (单位:字节)
cat /sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size
  • 什么样的代码能让 CPU Cache 更频繁的命中缓存?

我们使用go benchmark测试以下代码:

func arrayTravelIj(n int) {
  arr := make([][]int, n)
  for i, _ := range arr {
      arr[i] = make([]int, n)
  }

  for i := 0; i < n; i++ {
      for j := 0; j < n; j++ {
          arr[i][j] = 0
      }
  }
}

func arrayTravelJi(n int) {
  arr := make([][]int, n)
  for i, _ := range arr {
      arr[i] = make([]int, n)
  }

  for i := 0; i < n; i++ {
      for j := 0; j < n; j++ {
          arr[j][i] = 0
      }
  }
}

const N = 128

func BenchmarkArrayTravelIj(b *testing.B) {
  for i := 0; i < b.N; i++ {
      arrayTravelIj(N)
  }
}

func BenchmarkArrayTravelJi(b *testing.B) {
  for i := 0; i < b.N; i++ {
      arrayTravelJi(N)
  }
}

# 执行: go test -bench=^BenchmarkArrayTravel -benchmem .
# 结果: 
# cpu: Intel(R) Xeon(R) Gold 6278C CPU @ 2.60GHz
# BenchmarkArrayTravelIj-8           33397             35933 ns/op          134144 B/op        129 allocs/op
# BenchmarkArrayTravelJi-8           18099             66487 ns/op          134144 B/op        129 allocs/op
# PASS

可以看到,明明 内存分配次数运行时的内存大小 是一样的, 但是 BenchmarkArrayTravelIjBenchmarkArrayTravelJi 快了近一倍!

原因就是 BenchmarkArrayTravelIj 访问数据顺序是连续的,而 BenchmarkArrayTravelJi 访问数据顺序是跳跃的。

假如 N=2 ,那么 arr 在内存中的存储顺序为 arr[0][0],arr[0][1],arr[1][0],arr[1][1]。当N越来越大时,由 BenchmarkArrayTravelJi 访问数据顺序是跳跃的,那么 CPU Cache 命中率则会越来越低!

我的测试机器 L1 大小是32K,Cache Line 大小是64字节,那么意味着单个 Cache Line 能保存的int元素的数量是8个,整个 L1 CPU Cache 能保存的 Cache Line 条数是 512条。

换算一下就是整个 L1 CPU Cache 能保存的int元素是4096个,所以当N超过64时,随着N增大,两个函数的执行效率也会被越拉越大。

当然,64这个数字并不严谨,因为除了 CPU Cache 不仅只有 L1, 还有 L2, L3, 而且不同CPU的底层还会有各种硬件的加速内存预取策略

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,029评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,395评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,570评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,535评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,650评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,850评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,006评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,747评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,207评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,536评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,683评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,342评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,964评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,772评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,004评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,401评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,566评论 2 349

推荐阅读更多精彩内容