前言
作为一名 Java 从业者,虽然近几年,无论是使用规模、开发者人数,还是技术生态成熟度、相关工具的丰富程度,Java 都在后端开发语言中有着不可撼动的地位,也是开发各类业务系统的首选语言。
而且薪资也非常可观
(图源:职友集 2020年北京 Java 程序员的工资情况)
但很多同学却总有种“做不动”的感觉。项目还好说,用 Java 写系统代码都没有问题,可一旦有人问到 Java 程序运行起来以后内部发生了什么,怎么让它运行的更好?大多数同学就可能答不上来了。
而现在面试 Java 岗位,无论什么规模的公司,面试官必问到 JVM 相关的问题,什么线程、内存模型、JVM 运行时内存、垃圾回收与算法、GC 垃圾收集器、JAVA IO/NIO 、JVM 类加载机制等等知识点。
在面试中,这些问题如果答不好,可能直接影响你的薪资。
这里和大家分享一张 JVM 和性能优化大图,包含了 Java 工程师一定要花时间学会的Java 内存区域、垃圾回收器和内存分配策略、JVM 的执行子系统、编写高效优雅 Java 程序、性能优化等等知识点。(感兴趣的同学可以关注小编+转发文章后私信小编【666】即可领取高清完整版图谱)
接下来就带大家详细了解一下,2020 年一线大厂技术面试 JVM 知识的必考问题,看看你能答出几道?
什么情况下会发生栈内存溢出。
详解JVM内存模型
JVM内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为Eden和Survivor。
JVM中一次完整的GC流程是怎样的,对象如何晋升到老年代
你知道哪几种垃圾收集器,各自的优缺点,重点讲下cms和G1,包括原理,流程,优缺点。
说一说 JVM 运行时数据区?
GC 收集器有哪些?CMS 收集器与 G1 收集器的特点?
如何判断 Java 对象已经被回收?
垃圾回收算法有哪些?
堆和栈的区别是什么?
路思:描述栈定义,再描述为什么会溢出,再说明一下相关配置参数,OK的话可以给面试官手写是一个栈溢出的demo。
我的答案:
栈是线程私有的,他的生命周期与线程相同,每个方法在执行的时候都会创建一个栈帧,用存储局部变量表,操作数栈,动态链接,方法出口等信息。局部变量表又包含基本数据类型,对象引用类型
如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出StackOverflowError异常,方递
归调用产生这种结果。
如果Java虚拟机栈可以动态扩展,并且扩展的动作已经尝试过,但是无法申请到足够的内去完成扩展,或者在新建立线程的时候没有足够的内存去创建对应的虚拟机栈,那么Java虚拟机将抛出一个OutOfMemory 异常。(线程启动过多)
参数 -Xss 去调整JVM栈的大小
二详解JVM内存模型
思路: 给面试官画一下JVM内存模型图,并描述每个模块的定义,作用,以及可能会存在的题,如栈溢出等。
我的答案:
JVM内存结构
程序计数器:当前线程所执行的字节码的行号指示器,用于记录正在执行的虚拟机字节指令地址,线程私有。
Java虚拟栈:存放基本数据类型、对象的引用、方法出口等,线程私有。
Native方法栈:和虚拟栈相似,只不过它服务于Native方法,线程私有。
Java堆:java内存最大的一块,所有对象实例、数组都存放在java堆,GC回收的地方,线程共享。
方法区:存放已被加载的类信息、常量、静态变量、即时编译器编译后的代码数据等。(即永久带),回收目标主要是常量池的回收和类型的卸载,各线程共享
三JVM内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为Eden和Survivor。
思路: 先讲一下JAVA堆,新生代的划分,再谈谈它们之间的转化,相互之间一些参数的配(如: –XX:NewRatio,–XX:SurvivorRatio等),再解释为什么要这样划分,最好加一点自己的理解。
我的答案:
1)共享内存区划分
共享内存区 = 持久带 + 堆
持久带 = 方法区 + 其他
Java堆 = 老年代 + 新生代
新生代 = Eden + S0 + S1
2)一些参数的配置
默认的,新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 ,可以通过参数 –XX:NewRatio 配置。
默认的,Edem : from : to = 8 : 1 : 1 ( 可以通过参数 –XX:SurvivorRatio 来设定)
Survivor区中的对象被复制次数为15(对应虚拟机参数 -XX:+MaxTenuringThreshold)
3)为什么要分为Eden和Survivor?为什么要设置两个Survivor区?
如果没有Survivor,Eden区每进行一次Minor GC,存活的对象就会被送到老年代。老年代很快被填满,触发Major GC.老年代的内存空间远大于新生代,进行一次Full GC消耗的时间比Minor GC长得多,所以需要分为Eden和Survivor。
Survivor的存在意义,就是减少被送到老年代的对象,进而减少Full GC的发生,Survivor的预筛选保证,只有经历16次Minor GC还能在新生代中存活的对象,才会被送到老年代。
设置两个Survivor区最大的好处就是解决了碎片化,刚刚新建的对象在Eden中,经历一次MinorGC,Eden中的存活对象就会被移动到第一块survivor space S0,Eden被清空;等Eden区再满了,就再触发一次Minor GC,Eden和S0中的存活对象又会被复制送入第二块survivor spaceS1(这个过程非常重要,因为这种复制算法保证了S1中来自S0和Eden两部分的存活对象占用连续的内存空间,避免了碎片化的发生)
不同虚拟机的运行时数据区可能略微有所不同,但都会遵从 Java 虚拟机规范, Java 虚拟机规范规定的区域分为以下 5 个部分:
程序计数器
当前线程所执行的字节码的行号指示器,字节码解析器的工作是通过改变这个计数器的值,来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能;
Java 虚拟机栈
用于存储局部变量表、操作数栈、动态链接、方法出口等信息;
本地方法栈
与虚拟机栈的作用是一样的,只不过虚拟机栈是服务 Java 方法的,而本地方法栈是为虚拟机调用 Native 方法服务的;
Java 堆
Java 虚拟机中内存最大的一块,是被所有线程共享的,几乎所有的对象实例都在这里分配内存;
方法区
用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。
五、GC 收集器有哪些?
并行收集器:串行收集器使用一个单独的线程进行收集,GC 时服务有停顿时间。
串行收集器:次要回收中使用多线程来执行。
CMS 收集器是基于“标记—清除”算法实现的,经过多次标记才会被清除。
G1 从整体来看是基于“标记—整理”算法实现的收集器,从局部(两个 Region 之间)上来看是基于“复制”算法实现的。
六、如何判断 Java 对象已经被回收?
1、引用计数算法
为每个对象创建一个引用计数,有对象引用时计数器 +1,引用被释放时计数 -1,当计数器为 0 时就可以被回收。它有一个缺点不能解决循环引用的问题;
2、可达性分析法
从 GC Roots 开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是可以被回收的。
GC Roots:
1.虚拟机栈(本地变量表)引用的对象。
2.方法区静态属性引用的对象。
3.方法区常量引用的对象。
4.本地方法栈JNI(一般指naive方法)中引用的对象
图示 Object6、7、8 与起始点没有任何引用链,则说明不可用,需要被回收。
七、垃圾回收算法有哪些?
1、标记-清除(Mark-Sweep)
此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用, 同时,会产生内存碎片。
2、复制(Copying)
此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外一个区域中。
每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理,不会出现“碎片”问题。当然,缺点也是很明显的,需要两倍内存间。
3、标记-整理(Mark-Compact)
结合了前两个算法的优点,也是分两阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历整个堆,清除标记对象,并未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。
此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题。
总结
以上资料均出自阿里P8架构师,整理的《2020Java技术栈面试总结合集》
划重点!这份Java资源中包括:
Java、面向对象、多态、接口、IDEA、异常、集合框架、IO流、多线程、企业级框架、HTML、数据库、Java web、项目实战、GitHub、Spring、多线程、JVM、集合、多线程、MyBatis、MySQL、Git、IDEA、Redis、算法、简历模板、高频面试题、技术书籍、工具包、面试题等内容...