请简述 JVM 垃圾回收原理
JVM的组成架构如下图所示,其屏蔽了底层系统的不同,为Java字节码构造了统一的一个运行环境。
在Java语言中,存在4种引用类型,分别为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantorm Reference)。当对象间存在强引用关系时,JVM是无法将对象回收的;当对象间存在软引用时,内存足够时不会被回收,内存不足时会将这些对象回收;当对象间存在弱引用和虚引用时,一旦GC发生就会被回收。
JVM垃圾回收
JVM 垃圾回收就是将JVM 堆中的已经不再被使用的对象清理掉,释放宝贵的内存资源。
JVM 通过一种可达性分析算法进行垃圾对象的识别,具体过程是:从线程栈帧中的局部变量,或者是方法区的静态变量出发,将这些变量引用的对象进行标记,然后看这些被标记的对象是否引用了其他对象,继续进行标记,所有被标记过的对象都是被使用的对象,而那些没有被标记的对象就是可回收的垃圾对象了。
进行完标记以后,JVM 就会对垃圾对象占用的内存进行回收,回收主要有三种方法:
• 清理:将垃圾对象占据的内存清理掉,其实JVM 并不会真的将这些垃圾内存进行清理,而
是将这些垃圾对象占用的内存空间标记为空闲,记录在一个空闲列表里,当应用程序需要创
建新对象的时候,就从空闲列表中找一段空闲内存分配给这个新对象。
• 压缩:从堆空间的头部开始,将存活的对象拷贝放在一段连续的内存空间中,那么其余的空
间就是连续的空闲空间。
• 复制:将堆空间分成两部分,只在其中一部分创建对象,当这个部分空间用完的时候,将标
记过的可用对象复制到另一个空间中。
几种常见的垃圾回收器
- 串行垃圾回收器
最古老的垃圾回收器,串行操作,垃圾回收时会Stop-The-World,导致工作线程无法运行,系统无法响应 - 并行垃圾回收器
与串行垃圾回收器相比,仅仅是采用了多线程的方式进行垃圾收集,其他并没有变化 - CMS垃圾回收器
基于标记-清除(Mark-Sweep)算法,设计目标是尽量减少停顿的时间,这一点对于Web等反应时间敏感的应用非常重要,缺点是存在着内存碎片化的问题,所以难以避免在长时间运行等情况下发生full GC - G1垃圾回收器
这是一种兼顾吞吐量和停顿时间的GC实现,是JDK 9以后的默认GC。可以直观的设定停顿时间,将最差情况得到一定的提高。
并行与并发:G1 使用多个 CPU来缩短 Stop-The-World 停顿时间;
分代收集:虽然 G1 可以不需要其他收集器配合就能独立管理整个 GC 堆,但是还是保留了分代的概念;
空间整合:与 CMS 的“标记-清理”算法不同,G1 从整体来看是基于“标记-整理”算法实现的收集器;从局部上来看是基于“复制”算法实现的。这就意味着不会产生大量的内存碎片;
可预测的停顿:这是 G1 相对于 CMS 的另一个大优势,降低停顿时间是 G1 和 CMS 共同的关注点,但 G1 除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内。
学习总结
PrepareStatement 预编译
PrepareStatement 会预先提交带占位符的SQL 到数据库进行预处理,提前生成执行计划,当给定占位符参数,真正执行SQL 的时候,执行引擎可以直接执行,效率更好一点。
同时由于参数是用占位符的方式带入,可有效避免sql注入。
聚簇索引
聚簇索引的数据库记录和索引存储在一起。
MySQL 数据库的主键就是聚簇索引,主键ID 和所在的记录行存储在一个B+树中,因此使用主键查询仅需要一次就可以查到数据所在的行。
非聚簇索引
非聚簇索引在叶子节点记录的就不是数据行记录,而是聚簇索引,也就是主键。通过非聚簇索引找到主键索引,再通过主键索引找到行记录的过程也被称作回表。使用非聚簇索引需要先查询到聚簇索引,再通过聚簇索引查找到所在的行。
合理的使用索引
- 不要盲目添加索引,尤其在生产环境中
• 添加索引的alter操作会消耗较长的时间(分钟级)
• Alter操作期间,所有数据库的增删改操作全部阻塞,对应用而言,因为连接不能释放,事实上,查询也被阻塞。 - 删除不用的索引,避免不必要的增删开销
- 使用更小的数据类型创建索引
• int 4字节bigint 8字节,Timestamp 4字节Datetime 8字节
Java代码优化技巧
- 合理并谨慎使用多线程
最佳启动线程数和CPU 内核数量成正比,和IO 阻塞时间成反比。如果任务都是CPU计算型任务,那么线程数最多不超过CPU 内核数,因为启动再多线程,CPU 也来不及调度;相反如果是任务需要等待磁盘操作,网络响应,那么多启动线程有助于提高任务并发度,提高系统吞吐能力,改善系统性能。 - 竞态条件与临界区
在同一程序中运行多个线程本身不会导致问题,问题在于多个线程访问了相同的资源。当两个线程竞争同一资源时,如果对资源的访问顺序敏感,就称存在竞态条件。导致竞态条件发生的代码区称作临界区。
在临界区中使用适当的同步就可以避免竞态条件。 - 合理使用线程池和对象池
• 复用线程或对象资源,避免在程序的生命期中创建和删除大量对象
• 池管理算法(记录哪些对象是空闲的,哪些对象正在使用)
• 对象内容清除(ThreadLocal 的清空) - 使用合适的JDK 容器类(顺序表,链表,Hash)
• LinkList 和ArrayList 的区别及适用场景
• HashMap 的算法实现及应用场景
• 使用concurrent 包