引用计数基本知识###
每个php变量存在一个叫"zval"的变量容器中。一个zval变量容器,包括4个东西:变量的类型、变量的值、占用一个字节的bool值is_ref(标识是否是属于引用集合),占用一个字节的refcount(表示指向这个zval变量容器的变量个数)。
当一个变量被赋常量值时,就会生成一个zval变量容器,栗子:$a = "new string";在这里,生成了一个新的变量容器,类似是string,值是a,is_ref默认是false,因为没有任何自定义的引用生成,refcount是1,因为这里只有一个变量使用这个变量容器,并且当refcount=1时,is_ref用于是false。
把一个变量赋值给另一变量将增加引用次数(refcount),栗子:
$a = "new string";
$b = $a;
这时候$a容器变量的refcount=2,is_ref还是false,php不会复制已经生成的变量容器,当refcount=0时变量容器会自动销毁,任何关联到$a变量容器的变量执行unset时,refcount就会减一。
复合类型
考虑像array和object这样的复合类型,他们的变量是把他们的成员或属性保存在自己的符号表中,这意味着下面的栗子会生成3个zval变量容器: a,meaning和 number。
$a = array( 'meaning' => 'life', 'number' => 42 );
如果这个时候我们把$a已经存在的元素添加到$a中:
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
这时候$a[‘life’]的refcount就变成了2,实际上$a[‘meaning’]和$a[‘life’]指向的都是同一个变量容器。
把$a的引用作为一个元素添加到$a中:
$a = array( 'one' );$a[] =& $a;
$a的refcount变成了2,$a中的&$a指向的原始数组,这个时候如果unset($a),就会是这样:
这个时候已经没有任何作用域中的任何符号指向这个变量容器了,由于数组元素“1”仍然指向数组本身,所以这个容器不能被清除 。因为没有另外的符号指向它,所以没有办法清除这个结构,结果就会导致内存泄漏。庆幸的是,php将在脚本执行结束时清除这个数据结构,但是在php清除之前,将耗费不少内存。
php通过一个垃圾回收算法来处理这个内存泄漏的问题,这个算法就不在这里细说了,算法的基本规则:如果一个引用计数增加,它将继续被使用,当然就不再在垃圾中。如果引用计数减少到零,所在变量容器将被清除。就是说,仅仅在引用计数减少到非零值时,才会产生垃圾周期,php会把一些可能为垃圾的容器(可能根)放在一个根缓冲区中,当这个缓冲区满了就会执行垃圾回收操作。
默认的,PHP的垃圾回收机制是打开的, 可以通过php.ini 的zend.enable_gc 来设置。当垃圾回收机制打开时,每当根缓存区存满时,就会执行垃圾护手算法筛选出垃圾。根缓存区有固定的大小,可存10,000个可能根,可以通过修改PHP源码文件Zend/zend_gc.c中的常量GC_ROOT_BUFFER_MAX_ENTRIES,然后重新编译PHP,来修改这个10,000值。当垃圾回收机制关闭时,循环查找算法永不执行,然而,可能根将一直存在根缓冲区中,不管在配置中垃圾回收机制是否激活。
当垃圾回收机制关闭时,如果根缓冲区存满了可能根,更多的可能根显然不会被记录。那些没被记录的可能根,将不会被这个算法来分析处理。如果他们是循环引用周期的一部分,将永不能被清除进而导致内存泄漏。
即使在垃圾回收机制不可用时,可能根也被记录的原因是,相对于每次找到可能根后检查垃圾回收机制是否打开而言,记录可能根的操作更快。不过垃圾回收和分析机制本身要耗不少时间。