「计算机原理」| CPU 缓存 & 缓存一致性 & 伪共享

点赞关注,不再迷路,你的支持对我意义重大!

🔥 Hi,我是丑丑。本文 「计算机组成原理」| 导读 —— 已收录,这里有 Android 进阶成长路线笔记 & 博客,欢迎跟着彭丑丑一起成长。(联系方式在 GitHub)


前言

  • CPU 缓存是计算机组成原理中比较基础,同时也是比较常用的知识,面试中也可能会有一定延伸;
  • 在这篇文章里,我将总结CPU 缓存 & 缓存一致性 & 伪共享 等问题。如果能帮上忙,请务必点赞加关注,这真的对我非常重要。

目录


1. CPU 三级缓存

  • 背景: CPU 处理器的运算速度与内存存取速度、磁盘 I/O 速度不匹配(相差了几个数量级);
  • 目的: 提高 CPU 吞吐量;
  • 方案: 增加一个缓存层来协调两者的速度差,即:在 CPU 和内存中间增加一层 「高速缓存」,缓存的存取速度尽可能接近。

数据加载的流程如下:

  • 1、将程序和数据从磁盘加载到内存中;
  • 2、将程序和数据从内存加载到缓存中(三级缓存,数据加载顺序:L3->L2->L1);
  • 3、CPU将缓存中的数据加载到寄存器中(L0),并进行运算;
  • 4、CPU将数据同步回缓存,并在一定的时间周期之后同步回内存。

经验表明,CPU 往往需要重复读取同一个数据块,而缓存容量的增大,可以大幅度提升 CPU 内部读取数据的命中率,以此提升 CPU 吞吐量。但是出于 CPU 芯片体积和价格因素来考虑,缓存都不会很大。现代 CPU 芯片使用的是三级的高速缓存:

—— 图片引用自网络

最开始是寄存器(也称为 L0 缓存),接下来是 L1,L2,L3 三级缓存,最后是内存,本地磁盘,远程存储。从上到下空间越大,速度越慢,但是成本越低。需要注意的是:在现代 CPU 里,L0、L1、L2、L3 都集成在一颗 CPU 内部,其中 L0、L1、L2 是每个处理核心独立的,而 L3 是一颗 CPU 的多个处理器共用的。

—— 图片引用自网络


2. 缓存一致性问题

现代 CPU 通常有多个核心,每个核心也都有自己独立的缓存(L1、L2 缓存),当多个核心同时操作同一个数据时,如果核心 2 在核心 1 还未将更新的数据同步回内存之前读取了数据,就出现了缓存不一致问题。

举个例子,假设线程 A 和线程 B 同时对一个变量执行 i++,就可能存在缓存不一致问题:

  • 1、核心 A 和核心 B 从内存中加载了 i 的值,并且缓存到各自的高速缓存中,此时两个副本都为0;
  • 2、核心 A 进行加一操作,副本值变成了 1,最后回写到主存中,主存中的值为 1;
  • 3、核心 B 进行加一操作,副本值变成了 1,最后回写到主存中,主存中的值为 1;
  • 4、最终主存的值为 1,而不是期望的 2。

为了解决缓存不一致性问题,通常来说有两种解决方法:

  • 1、锁总线

早期的 CPU 是通过在锁总线来解决缓存不一致的问题。锁总线是对整个内存加锁,在锁总线期间,其他处理器无法访问内存,可想而知会严重降低 CPU 性能。

  • 2、缓存一致性协议(MESI)

缓存一致性协议提供了一种高效的内存数据管理方案。「锁内存方案」相当于保证了整块内存的一致性,而「缓存一致性协议方案」本质上相当与一致性保护范围,从整块内存缩小为单个缓存行(缓存行是缓存的基本单元)。

简单来说:当 CPU 核心准备写数据时,如果发现操作的变量是共享变量(即在其他核心中也存在该变量的副本),就会通知其他核心该变量「缓存行」无效,需要重新从内存读取。

具体来说,MESI 协议会将缓存数据定义为四种状态:

状态 描述
E(Exclusive) 独享 / 互斥
S(Shared) 共享
M(Modify) 修改
I(Invalid) 无效

详细工作原理:

  • 1、核心 A 从内存中加载变量 i,并将缓存行设置为 E(独享),随后通过总线嗅探检查内存中对变量 i 的操作;
  • 2、核心 B 从内存中加载变量 i,总线嗅探机制会将核心 A 与核心 B 的缓存行设置为 S(共享);
  • 3、核心 A 对变量 i 进行修改,缓存行设置为 M(修改),而核心 B 被通知修改缓存行为 I(无效)。如果存在高并发,则交给总线裁决;
  • 4、核心 A 将修改后数据同步回内存,并将变量设置为 E(独享);
  • 5、核心 B 重新刷新缓存行,并将缓存行核心 A 和核心 B 的缓存行设置为 S(共享)。

易混淆: MESI 协议是 CPU 的协议,JMM 也有自己的协议来保证缓存一致性。


3. 伪共享(False Sharing)

在 CPU 缓存中,缓存管理的基本单位并不是「字节」,而是「缓存行(Cache Line)」。缓存行的大小取决于 CPU,一般是 64 字节。

缓存行的设计源于:“CPU 读取一个数据之后,往往还需要重复读取附近的数据”。使用缓存行一次将一小块数据加载进高速缓存,有助于提高运算效率。

—— 图片引用自网络

当然,缓存也不是完美的,也存在副作用 —— 伪共享。伪共享是指多个线程同时读写同一个缓存行中的变量,而导致缓存行失效的问题。尽管两个线程分别访问的是不同的数据,但由于它们存在同一个缓存行中,只要任何一方修改都会使得缓存失效,降低了运算效率。

解决伪共享的方法是 「字节填充」,即通过在两个变量中间的内容填充额外的字节,使得两个变量存放在到不同缓存行中,从而规避伪共享问题。

在使用字节填充时,需要先考虑哪些变量是独立变化的,哪些变量是协同变化的。协同变化的变量放在一组,而无关的变量分到不同组。这样当修改变量时,不会导致无关变量的缓存行无效。

在 Java 中,Java 8 前后的处理方式不同:

  • Java 8 之前:通过填充 long 变量来分组
public class DataPadding{
    long a1,a2,a3,a4,a5,a6,a7; 防止与前一个对象产生伪共享
    int value1;
    long value2;
    long b1,b2,b3,b4,b5,b6,b7; 防止两组变量伪共享;
    boolean flag;
    long d1,d2,d3,d4,d5,d6,d7; 防止与下一个对象产生伪共享
}
  • Java 8:通过 @sun.misc.Contended 分组

@Contended 注解是 JDK 1.8 新增的注解,用于将变量划分到不同的缓存行。

例如:
Java 8 Thread.java

 /** The current seed for a ThreadLocalRandom */
@sun.misc.Contended("tlr")
long threadLocalRandomSeed;

/** Probe hash value; nonzero if threadLocalRandomSeed initialized */
@sun.misc.Contended("tlr")
int threadLocalRandomProbe;

/** Secondary seed isolated from public ThreadLocalRandom sequence */
@sun.misc.Contended("tlr")
int threadLocalRandomSecondarySeed;

Java 8 ConcurrentHashMap.java

@sun.misc.Contended static final class CounterCell {
        volatile long value;
        CounterCell(long x) { value = x; }
    }

提示: 需要 JVM 开启字节填充功能 -XX:-RestrictContended


4. 总结

  • 由于 CPU 处理器的运算速度与内存存取速度、磁盘 I/O 速度不匹配,所以 CPU 中会增加一层缓存来协调两者的速度差。CPU 缓存是一个三级结构,其中 L0、L1、L2 是每个处理核心独立的,而 L3 是一颗 CPU 的多个处理器共用的;

  • 由于 CPU 每个核心也都有自己独立的缓存(L1、L2 缓存),当多个核心同时操作同一个数据时,如果核心 2 在核心 1 还未将更新的数据同步回内存之前读取了数据,就出现了缓存不一致问题。解决方案有「锁总线」&「缓存一致性协议」;

  • 由于 “CPU 读取一个数据之后,往往还需要重复读取附近的数据”,所以 CPU 设计了缓存行(Cache Line)作为基本单位。当然,缓存页存在副作用 —— 伪共享,即:当多个线程同时读写同一个缓存行中的变量,而导致缓存行失效的问题。解决方案是「字节填充」,使得两个变量存放在到不同缓存行中。Java 8 之前采用填充 long 变量,而 Java 8 之后采用 @sun.misc.Contended 注解。


创作不易,你的「三连」是丑丑最大的动力,我们下次见!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,864评论 6 494
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,175评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,401评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,170评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,276评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,364评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,401评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,179评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,604评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,902评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,070评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,751评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,380评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,077评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,312评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,924评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,957评论 2 351

推荐阅读更多精彩内容