首先我们要清除的认识到代码和数据在运行过程中是怎么一个过程
从进程虚拟地址空间来看,程序要执行的指令在代码段,全局变量、静态数据等都会分配在数据段。而函数的局部变量、参数和返回值都可以在函数栈帧中找到。
但是,由于函数调用栈会在函数返回后销毁,那些在编译阶段不能确定大小的数据,以及生命周期超出当前函数的数据,都不适合分配在栈上。它们会被分配到堆上,在栈上使用其在堆上的地址,也就是所谓的”动态数据类型“
那么什么是垃圾呢?随着程序的运行有些数据就不会在用到了,那么它就没有了存在的意义了,也就成为了垃圾。
直接分配在栈上面的数据随着函数调用栈的销毁就over了。
但是分配在堆上面的数据,他们所占的内存必须程序手动释放才可以,否则就会一直存在。
垃圾回收分为两种方式
- 手动垃圾回收
需要程序员手动的进行内存的释放。
缺点:出错率高,容易出现”悬挂指针“和内存泄漏问题。分别对应为,释放过早和未释放导致的两种问题。
优点:编程语言本身,并不需要去关注哪些未垃圾,需要清理。提升运行速度,而且更加的灵活。 - 自动回收垃圾
编程语言已经实现好了的,垃圾自动回收机制。
优点:十分方便
缺点:需要时刻关注内从中的变换情况。
我们针对自动垃圾回收开始讨论
如何区分哪些是有用的数据?哪些为垃圾?
首先我们要明确一点,我们所能用到的堆上面的数据都是通过站上面的指针,跟踪到的。
这也就有了我们的第一个思路,从栈上面的指针出发,如果能跟踪到的都不是垃圾,剩余的则全部清理。
这也是目前主流的清理算法思路,可达性近似于有用性。因为可达并不代表后续有用,但是不可达一定没用。
接着分析集中主流的垃圾回收算法
- 标记--清除法
首先把垃圾标记出来,然后再把垃圾清理掉
标记过程也是通过将所有栈上面的指针作为根节点,能到达的都进行标记,剩下没有标记的就是垃圾。
三色抽象”可以清晰的展现追踪过程中数据标记的变化:
(1)垃圾回收开始会把所有数据都标记为白色;
(2)然后把直接追踪到的root节点都标记为灰色,灰色代表基于当前节点展开的追踪还未完成;
(3)当基于某个节点的追踪任务完成后,便会把该节点标记为黑色,表示它是有用数据,而且无需基于它再次进行追踪了。
(4)当没有灰色节点时,就意味着标记工作可以结束了。此时有用数据都为黑色,垃圾都为白色,在清除阶段回收这些白色的垃圾即可。
这样做虽然很简单,但也有着很多的问题。
例如:内存碎片化,由于内存对齐问题》》碎片化的内存极大影响了程序的执行效率,这就有了后续改进的方法。后续再聊,内存对齐、