初识 JAVA 内存模型:结合硬件内存架构理解 JAVA 内存模型

写在前面

JAVA 内存模型是我看过很多遍,也忘了很多遍,每隔一段时间就会感到模糊的一部分内容。直到我阅读了 Jakob Jenkov 大神这篇对初学者非常友好的 Java Memory Model。我对其做了翻译,一方面加深理解,便于日后复习,也希望能够帮到更多需要的伙伴。【非逐字翻译,英文不错的同学建议阅读原文】
相比之前读过的大部分书籍和博客,这篇文章没有在一开始就引入过多的细节。而是先以一个宏观的视角切入,让读者先对 JAVA 内存模型有一个清晰的上层认识。再结合硬件内存架构模型,讲述了 JAVA 内存模型与硬件内存架构模型的关系与区别(初学者非常容易混淆 JAVA 内存模型和硬件内存模型)。这两点恰恰是我在学习 JAVA 内存模型的过程中,最大的痛点。

为什么学习 JAVA 内存模型

宽泛的说学习 JAVA 内存模型能让我们对 JAVA 程序的运行有一个更清晰的认识。更具体的,通过 JAVA 内存模型,我们可以了解到不同线程对于共享的变量,是如何读写的。以及如何在必要的时候,以同步的方式(syncronize)访问共享变量。这对我们理解 JAVA 多线程编程,以及写出正确的多线程并行程序十分重要。

JAVA 内存模型

JAVA 内存模型是 JVM 内部的一种内存模型,逻辑上可以主要分为线程栈(Thread Stack)和堆(Heap)两部分,如下图所示:


Java Memory Model

线程栈(Thread Stack)

每个线程都拥有自己的线程栈,线程栈里面存放着相应线程执行方法(Method)时涉及的所有本地变量(local variables)。每个线程只能访问自己的线程栈,线程栈之间是互相不可见的。
所有基本类型(boolean, byte, short, char, int, long, float, double)的本地变量是直接存储于线程栈内的,线程间均不可见。一个线程可能会通过拷贝的方式,把自己线程栈内的基础类型变量提供给另一个线程。但一定无法直接提供该变量本身。
所有对象类型的变量,栈中存储的都只是一个引用,对象本身存储于堆中。

堆(heap)

JAVA 应用中,所有的对象都是存储在堆中的——包括对象版本的基础类型(Byte, Integer, Long 等等)。可以总结为下图:


Java Memory Model 2
  1. 基础类型的本地变量是直接存储在线程栈中的。
  2. 非基础类型的本地变量(即对象引用变量),线程栈中存储的只是一个引用,实际的对象是存储在堆中的。
  3. 堆中对象可能会包含成员变量,这些成员变量无论是基础类型变量,还是对象引用类型的变量,都会随对象存储在堆中。
  4. 静态变量,随其所属类一并存储于堆中。

举个例子

为了展示变量在线程栈和堆中的存储情况,我们参照图片 Java Memory Model 2,写了如下代码:

public class Main{
  public static void main(String[] args){
    Thread thread1 = new Thread(new MyRunnable());
    Thread thread2 = new Thread(new MyRunnable());
    thread1.start();
    thread2.start();
  }
}
public class MyRunnable implements Runnable {

    public void run() {
        methodOne();
    }

    public void methodOne() {
        int localVariable1 = 45;

        MySharedObject localVariable2 =
            MySharedObject.sharedInstance;

        //... do more with local variables.

        methodTwo();
    }

    public void methodTwo() {
        Integer localVariable1 = new Integer(99);

        //... do more with local variable.
    }
}
public class MySharedObject {

    //static variable pointing to instance of MySharedObject

    public static final MySharedObject sharedInstance =
        new MySharedObject();


    //member variables pointing to two objects on the heap

    public Integer object2 = new Integer(22);
    public Integer object4 = new Integer(44);

    public long member1 = 12345;
    public long member2 = 67890;
}

代码中,两个线程都会执行 MyRunnable 类的 run 方法,run 方法调用 methodOne,methodOne 调用 methodTwo。最终各变量的存储和关系可以描述为下图:


Java Memory Model 3

结合代码和这张图,我们应该能清晰了解到 JAVA 代码中各变量,实际运行时 JAVA 内存模型中的存储位置了。

硬件内存架构

开头我们说过,JAVA 内存模型只是 JVM 内部的一种内存模型。它和我们熟悉的硬件内存架构模型有什么关系?又是如何一起工作的呢?
我们先了解一下硬件内存架构,如下图所示:


Hardware Memory Architecture 1

现在常见的电脑都是多 CPU 或者多核的,这也是为什么我们的电脑可以实际支撑真实的多线程并行工作。在这样的电脑上执行多线程并行的 JAVA 程序时,不同的线程是有可能运行在不同的 CPU 上的。
每个 CPU 都有一组寄存器(CPU Registers)—— CPU 内部的内存。由于寄存器比主存(Main Memory)更快,CPU在操作存储于寄存器的数据时,会比操作主存数据快的多。
现在的 CPU 都还通常会有一个 CPU 缓存层(CPU Cache Memory Layer)。操作缓存层的速度介于寄存器和主存之间。(注:有的 CPU 也会设计多级缓存,比如 Cache Memory Layer1,Cache Memory Layer2 等,了解即可,不影响我们此处对 CPU 缓存的理解)
计算机都会有一个主存(Main Memory)。所有 CPU 都可以访问它。
通常来说,CPU 把需要的部分数据从主存拷贝到缓存,缓存中的部分数据会被拷贝到寄存器,然后基于寄存器内的数据完成计算,最终将结果逐级会写到主存中。(在某个恰当的时机将寄存器的数据写回缓存,然后再在某个恰当的时机把缓存的数据写回主存,比如我们需要释放一部分缓存在存储我们此时需要用到的其他数据)。

JAVA 内存模型和硬件内存架构的关系

硬件内存架构并不按照堆,栈区分。实际上,JAVA 内存模型中堆和栈存储的数据,都会存储到硬件内存的主存上。而在某些时间点,部分的堆/栈数据也会出现在 CPU 缓存,或者寄存器上。如下图所示:


Java Memory Model & Hardware Memory Architecture

一台电脑有多个CPU,多个寄存器,多个缓存。而我们的 JAVA 对象/变量可能存储在这么多不同的位置,这就直接带来了两个问题:

  1. 共享变量(shared variables)在线程间的可见性问题
  2. 共享变量在多线程读写时的竞争条件(race condition)问题

共享变量的可见性问题

写 JAVA 代码时我们知道,在没有正确使用 volatile 关键字或者 synchronization 时,一个共享变量被线程A的修改,对线程B而言可能是不可见的。
这个比较好理解,两个运行于不同CPU的线程,分别从主存拷贝同一个变量到各自CPU的缓存甚至是寄存器中,由于他们后续一段时间对该变量的读写都仅仅发生在各自的缓存或寄存器内的拷贝上,这些修改对不同线程间是不可见的。如下图所示:

Visibility of Shared Objects 1

通过使用 volatile 关键字可以解决该问题。经过 volatile 修饰的变量,每次都会直接从主存读取,并且保证每一次的修改都会回写到主存上。

竞争条件(race condition)

当多个线程想要同时修改同一个共享变量的时候,就会产生竞争条件问题。
假设我们有两个执行在不同CPU的线程:线程A和线程B。他们都读取了主存中的一个共享变量 count = 1。然后分别在各自 CPU 缓存内对其做了 +1 操作。原本我们期望的计算结果是 count + 1 + 1 = 3。但由于这两次 +1 操作在不同的 CPU 缓存内同时进行,最终线程A和B将自己计算的结果回写到主存时,结果为:count + 1 = 2。如下图所示:


Race Condition.png

该问题可以通过同步化来处理——保证一段代码,同一时间,只能有一个线程执行。JAVA 中同步化操作通过 synchronized 关键字实现。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容