线上OOM问题排查

(1),知识储备

1),JVM与JMM

  1. JVM是Java虚拟机,负责加载和执行字节码文件,使得Java程序可以跨平台运行。同时其还要负责管理程序运行时的内存,包括堆、栈和方法区等;按照算法规则自动回收不再使用的内存,避免内存泄露。
  2. JMM是Java中的内存模型,定义了Java程序中如何访问和修改共享变量的规则。其提供了一些规定,以确保多线程环境中变量的可见性、顺序性和原子性。
    • 保证可见性:在多线程环境下,确保线程对共享变量的修改对其他线程是可见的。
    • 保证有序性:保证程序中各个操作的执行顺序符合预期(例如:防止指令重排序)。
    • 保证原子性:确保对共享变量的操作是原子性的,防止多个线程同时访问并修改一个变量导致不一致的结果。
      | 特性 | JVM | JMM |
      | -------------- | ---------------------------------------- | ---------------------------------------------------- |
      | 定义 | Java 虚拟机,是一个运行时环境。 | Java 内存模型,定义了共享内存访问规则。 |
      | 作用 | 执行 Java 程序,提供内存管理和垃圾回收。 | 保证多线程中变量的可见性、原子性和有序性。 |
      | 关注点 | 程序执行、内存管理、跨平台性。 | 多线程并发中的内存访问规则。 |
      | 内存管理 | 管理堆、栈、方法区等内存区域。 | 通过主内存和工作内存控制共享数据的访问。 |
      | 多线程机制 | JVM 负责线程的创建、调度和管理。 | JMM 通过内存模型保证线程间的正确同步。 |
      | 例子 | JVM 通过 JIT 编译器优化执行。 | JMM 通过 volatilesynchronized 保证线程安全。 |
  3. JVM 如何与 JMM 配合工作?
    • JVM 管理内存:JVM 管理程序的堆、栈和方法区等内存区域,负责内存分配和回收。
    • JMM 保证内存一致性:在多线程环境下,JMM 确保不同线程对共享数据的访问不会导致不一致的状态。
      • 例如,当一个线程修改了一个变量(如 x = 10),JMM 会确保其他线程在读取 x 时看到这个修改。
      • 同时,JVM 会通过 synchronizedvolatile 等机制实现 JMM 定义的内存一致性要求。
  4. JVM提供了线程调度和内存管理的基础,JMM确保了多线程访问共享数据时的正确性和一致性。

(2),OMM问题

1),排查思路

常见出现OOM(Out Of Memory)的原因有代码漏洞、内存泄露、内存溢出和分配过少。

  1. 代码漏洞:某一个对象在循环中不断的被申请,且用完后未释放,导致内存耗尽。
  2. 内存泄露:更偏向于内存使用完后没有释放,导致虚拟机不能再将该内存分配其他线程。
  3. 分配过少和内存溢出:分别指的是一开始分配的内存数是不合理的;或者即便是合理的,但是程序申请过多了,超过了分配的最大内存。

2),常规排查步骤

线上如遇到JVM内存溢出,可以分以下几步排查:

  1. jmap -heap:查看是否内存分配过小。
  2. jmap -histo:查看是否有明显的对象分配过多且没有释放情况。
  3. jmap -dump:导出JVM当前内存快照,使用JDK自带或MAT等工具分析快照。
    1. 如想使用“MAT等工具”分析快照,前提是在JVM参数中配置在发生异常时自动导出内存快照:-XX:+HeapDumpOnOutOfMemoryError-XX:HeapDumpPath=./:指定内存快照文件的生成路径。

如果上面还不能定位问题,那么需要排查应用是否在不断创建资源,比如网络连接或者线程,都可能会导致系统资源耗尽。

3),常见的两种OOM报错日志

  1. java.lang.StackOverflowError:虚拟机栈溢出,一般是由于程序中存在死循环或者深度递归调用造成的。如果栈大小设置过小也会出现溢出,可以通过-Xss设置栈的大小
  2. java.lang.OutOfMemoryError: Java heap space:Java堆内存溢出,溢出的原因一般由于JVM堆内存设置不合理或者内存泄漏导致。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容