JVM 参数设置参考:https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html
- 可以看到JVM的内存结构有堆,虚拟机栈,本地方法栈,程序计数器,方法区,其中:
1.堆和方法区是线程共享的,所有的线程都共享这两个区域数据,在还没有线程启动的时候这两个区域就已经划分好了。
2.虚拟机栈,本地方法栈,程序计数器是每个线程都有的东西,相互隔离
-
一.堆
可以看到堆由新生代,老年代,持久代组成,其中新生代又分为几类组成,而在JDK的1.8之前和之后有变化,由之前的持久代去掉改为元空间,这个元空间使用的是本地内存。
-
二.虚拟机栈
每个线程都有他自己的虚拟机栈空间,这里会有很多栈帧,每一次方法的调用都会产生一个栈帧去压栈,当方法返回的时候对应栈帧的出栈操作,每个栈帧都会对应一些数据,如图,其中操作数栈主要存储的是临时数据。
栈都是先进先出的一种数据结构,所以方法调用就会在虚拟机栈中形成一个个栈帧,然后先进先出。
而每一个栈帧都包含:
- 局部变量(不仅仅包含基础类型数据,也包含对象的引用,当然new出来的对象一般会存放在堆中)
- 操作数栈
- 动态链接
- 完成出口(返回地址)
在计算机中,执行操作是有cpu+缓存+主内存,而虚拟机住过要达到同样的效果,也是需要仿照计算机中的结构,因此虚拟机中,java执行引擎对应计算机中的cpu,操作数栈对应缓存,栈或堆对应主内存:
下面我们实例来讲解一下虚拟机栈的运行过程:
如上图的代码,我们经过编译之后,就成了一个class文件,然后反编译一下就是下图的黑色防框中的内容:
在code中是字节码指令,不是很了解就可以百度一下:
1.第一步是 iconst_1 就是把常量1给压入到操作数栈
2.第二步istore_1 就是将1的常量从操作数栈给压出存储到局部变量表1的位置;
然后依次类推,接下来就是把常量2给压入到操作数栈,然后再从操作数栈压出存储到局部变量表-
3.iload_1 就是把下标为1,也就是我们之前存储到局部变量表中下表为1的数据给压入到操作数栈,iload_2同理;
之后会进行一个操作,就是两个数据相加,在这一步虚拟机会把两个操作数栈压出放在执行引擎(类似于cpu)中,然后加完之后的结果为3,再把3这个常量给压入到操作数栈;
4.然后下一步是bipush,意思与iconst一样,只不过iconst能够操作的数据范围有限,所以这次把10压入到操作数栈得用bipush;
5.然后下一步就类似于加操作,还是把两个数据拿出来,执行引擎进行相乘的操作,然后=10,再放入到操作数栈。
6.最后一个执行是ireturn是方法的返回指令,但是在执行这个命令之前还是要把结果30给压入到操作数栈,因为执行引擎执行操作的时候只能执行操作数栈的东西,所以就得先把结果给压入到操作数栈,然后再返回。
问题一、而针对于地址为什么不是连续的?
这里主要是因为地址编号主要是字节码针对于work这个方法的偏移量,在9之前都是连续的,但是7这个常量占用空间大,所以偏移远了,所以才到了9;而程序计数器就是记录当前字节码执行的地址,比如当前正在执行6地址的字节码,那么该线程的程序计数器就是6。
问题二、为什么要用程序计数器?
学过操作系统都知道操作系统有一个CPU时间片轮转机制,就是说cpu的执行速度非常快,打比方1秒钟的时间可以执行非常多的操作,于是操作系统就把1秒钟给划分成为很多的时间片,然后不规则的分配给各个线程,比如执行完一个时间片的线程,然后切换到另一个线程,这个时候你不就得知道之前线程执行到哪里了对吧?!这样的话,即使是多线程,程序的执行仍然不会乱掉。
问题三、 jvm里面不会发生内存溢出的是哪个区域
程序计数器,因为程序计数器本质上就是记录地址,变化,并不会额外的多出空间,所以不会发生内存溢出
-
三.本地方法栈
我们通常使用的是java的方法,他属于虚拟机栈,而本地方法栈是另一类,这个是由C语言实现的。
本地方法栈就类似于图片中的方法,不是在java实现的,而是使用c或者c++实现的。
问题一、为什么需要本地方法栈?
主要就是因为在研发java语言初期,有些功能jvm实现不了,需要借助其他语言(C,C++)实现,而这些方法就叫做本地方法。
问题二、为什么要在内存中划分一块本地方法栈?
虚拟机规范,这里也是为了和其他方法栈区分,所以单独划分出来了,也有一些其他版本的虚拟机将虚拟机栈与本地方法栈给合二为一了。
-
四.程序计数器
程序计数器用来记录各个线程的字节码地址,例如分支,跳转,循环,异常,线程恢复等都需要用到程序计数器;而java是可以做多线程的,如果做多线程,一条线成在做的东西忽然cpu资源被另一个线程抢过去使用,然后又切换到这个线程继续做他该做的事情,那么这个线程就需要知道从哪里开始做,程序计数器记录的是指令之类的可以提供给线程执行。
-
五.方法区
方法区也是多个线程共享的,而且方法区和堆之间是存在交集的,可以从图中看出来,方法区的一些变量是存储在堆上面的,比如静态变量,字符串常量池都是在堆上的,而类信息和运行时常量池都是在元空间的,这个是针对JDK8以及之后的JDK,而在JDK8之前的JVM方法区都是在堆上建立的,是在堆上使用永久代或者说是持久代来实现方法区的,这点需要注意。
至于为什么堆在JDK8之后移除了持久代呢,一句话就是:由于永久代内存经常不够用或发生内存泄露,爆出异常java.lang.OutOfMemoryError: PermGen,我个人总结就是持久代的内存不好控制,因为是在JVM的内存中,详细请参考该文章:
https://blog.csdn.net/sjmz30071360/article/details/89456177
绝大部分 Java 程序员应该都见过 "java.lang.OutOfMemoryError: PermGen space "这个异
常。这里的 “PermGen space”其实指的就是方法区。不过方法区和“PermGen space”又有着本质
的区别。前者是 JVM 的规范,而后者则是 JVM 规范的一种实现,并且只有 HotSpot 才有
“PermGen space”,而对于其他类型的虚拟机,如 JRockit(Oracle)、J9(IBM) 并没
有“PermGen space”。由于方法区主要存储类的相关信息,所以对于动态生成类的情况比较容易
出现永久代的内存溢出。最典型的场景就是,在 jsp 页面比较多的情况,容易出现永久代内存溢
出。我们现在通过动态生成类来模拟 “PermGen space”的内存溢出: