最近在画像项目里需要将某个标签进行筛选,但是有个操作是直接把数据从库里面拿出千万级别的标签放进内存中进行遍历操作,然后程序直接挂了。于是很好奇研究了下平时代码中会不会出现内存溢出的问题。
内存泄漏与内存溢出的概念
在long long ago,相传编程语言存在鄙视链,C鄙视C++,C++鄙视Java,Java鄙视c#,结果最后PHP莫名其妙成了世界上最好的语言(真香警告)。在大学的时候,一开始学C++程序总是容易崩溃,因为在C++中,对象占用的内存空间都必须有我们自己来显式回收,如果处理完之后忘记了回收内存,那它们所占用的内存空间就会产生内存泄漏,很容易造成程序的崩溃。对于Java来说,JVM垃圾回收机制会自动回收无用对象所占用的内存空间而不需要我们手动去释放。理论上在Java中是不存在内存泄漏与内存溢出的场景,但实际上,如果使用不当,Java程序也会存在内存泄漏的问题。
程序在运行过程中会不断地分配内存,那些不再使用的内存空间应该及时回收,从而保证系统可以再次使用这些内存,如果存在无用的内存没有被回收,那么这内存空间就存在内存泄漏。一般来说不可达的对象都是由JVM垃圾回收机制去回收,但是有些对象处于可达状态,程序却无法再去访问,那么这些对象所占用的内存空间就无法进行回收,所在空间就存在内存泄漏。简而言之也就是被分配的对象可达却无用。
- 在垃圾回收机制中,通过一系列称为“GC Roots”的对象作为起点,从这些节点开始向下搜索,搜索所走过的路径称为应用链,一个对象到GC Roots没有任何引用链相连,用图论的话来说就是从GC Roots到这个对象不可达,对于GC Root无法达到的对象便是垃圾对象,随时可被GC回收。相反,可达对象便是存活对象不会被GC回收。
简单来说当我们服务器内存不足以给程序分配内存空间时,此时程序就会报内存溢出错误。也就是内存泄漏是诱因,在多次积累之后会导致内存溢出。
分析Java运行时内存情况
了解了内存泄漏的概念之后,为了更准确定位导致内存泄漏的地方,有必要先分析下Java在运行时内存的使用情况。
方法区:在Java虚拟机中,方法区是可供各条线程共享的运行时的内存区域,也就是说所有线程都可以共享。它存储了每一个类的结构信息,例如,运行时常量池、字段和方法数据、构造函数和普通方法的字节码内容,还包括一些在类、实例、接口初始化时用到的特殊方法。方法区逻辑上属于堆的一部分,但是为了与堆进行区分,通常又叫“非堆”。
在JDK1.7及以前,HotSpot里面对方法区的实现称为永久代(PermGen space),为何会称为永久代呢?主要是在之前认为方法区存放的数据例如常量池,静态变量和 类是静态的,几乎不会被GC回收可以长时间存放在该区域中。这种情况下方法区是很容易发生内存溢出的,例如用cblib的代态代理通过反射生成类的时候。
因此,在JDK1.8之后,HotSpot 已经没有 “PermGen space”这个区间了,而是用元空间(Metaspace)来代替了。本质上永久代和元空间都是对JVM规范中方法区的实现,不过双方有很大的区别就是方法区使用的是虚拟机的内存,元空间使用的是本地内存。也就是你的服务器有多大内存,元空间就可以设置多大的内存。默认情况下,元空间的大小仅受本地内存限制,但可以通过以下参数来指定元空间的大小。所以使用本地内存可以尽可能的避免内存溢出。-
堆:堆内存也是所有线程共享的,在虚拟机启动的时候就已经创建好了。大部分对象以及数组都是在堆上分配的,为何不是所有对象都有堆分配呢?在使用Java的时候,一般会认为Java 创建的对象都是被分配到堆内存上的,实际上Java中的逃逸分析可以导致对象不再堆中分配。在《深入了解Java虚拟机》一书中有章节描述Java逃逸分析技术。这堆空间可由 GC 进行回收,当无法回收内存空间的时候会抛出OutOfMemoryError。
虚拟机栈:每一条 Java 虚拟机线程都有自己私有的 Java 虚拟机栈,这个栈与线程同时创建,栈里面存着的是一种叫“栈帧”的东西。每个方法会创建一个栈帧,栈帧中存放了局部变量表(基本数据类型和对象引用)等信息。栈帧随着方法调用而创建,随着方法结束而销毁——无论方法是正常完成还是异常完成(抛出了在方法内未被捕获的异常)都算作方法结束。栈可以被实现成固定大小,也可以根据计算动态来扩展和收缩。如果线程请求分配的栈容量超过 Java 虚拟机栈允许的最大容量,Java 虚拟机将会抛出一个StackOverflowError 异常。
内存泄漏与内存溢出场景
- 内存中加载的数据量过于庞大,如一次从数据库取出过多数据,这就会造成内存溢出问题。
-
长生命周期对象持有短生命周期对象的引用。造成内存泄漏
上述demo中,由于obj对象一直被静态map引用,对于GC来说,该对象可达但无用,这就存在内存泄漏。
-
代码中存在循环产生过多重复的对象实体。造成堆内存溢出(OutOfMemoryError: Java heap space)
上述demo中,造成了堆内存溢出。在开始创建对象时候,对象只会存在于Eden区和Survivor区,当Eden区不够空间的时候就会触发Minor GC将对象复制到Survior区,当Survior区不够的时候就会复制到老年代。当老年代空间不够就会触发Full GC对整个堆进行Full GC,但是这次Full GC并不会回收对象的软连接。如果还不够空间就会再次进行Full GC,这时会对软连接进行回收。所以当你的项目频繁进行Full GC的时候,很有可能存在内存泄漏。
- 当加载到方法区的class太多的时候就可能会报出permgen溢出的错误。(OutOfMemoryError: PermGen space)特别是用cglib动态生成类 的时候。
-
代码中存在死循环或递归调用,会产生栈溢出。(StackOverflowError)
- 对文件流,数据库连接流等操作没有关闭流(emmmmm 静态工具检查最多这个问题。。)
排查方式
- 生成dump文件,借助工具例如MAT进行分析
- 利用jps命令查找Java进程pid
- 使用命令top -p <pid> ,显示Java进程的内存情况
- jstat -gccause pid 10000 每各10秒输出结果