PHP 垃圾回收机制详解
- 前言:之前对PHP的GC只是了解了个大概,这次详细了解下PHP的垃圾回收机制(GC)。
介于网上大部分都是PHP5.X的GC,虽然 php5 到 php7 GC部分做出的改动较小,但我觉得还是一起写下来比较好
一、原理
- php5和php7的垃圾回收机制都是利用引用计数
二、php5和php7不同点
- 1、PHP5标量数据类型会计数,PHP7标量数据类型不再计数,不需要单独分配内存
- 2、PHP7的zval 需要的内存不再是单独从堆上分配,不再自己存储引用计数。
- 3、PHP7的复杂数据类型(比如数组和对象)的引用计数由其自身来存储。
三、变量在zval的变量容器中结构
- zval中,除了存储变量的类型和值之外,还有is_ref字段和refcount字段
- 1、is_ref:是个bool值,用来区分变量是否属于引用集合。
- 2、refcount:计数器,表示指向这个zval变量容器的变量个数。
四、PHP5.3标量在zval容器例子
注意:php5.3中将一个变量 = 赋值给另一个变量时,不会立即为新变量分配内存空间,而是在原变量的zval中给refcount加1。 只有当原变量或者发生改变时,才会为新变量分配内存空间,同时原变量的refcount减 1 。当然,如果unset原变量,新变量直接就使用原变量的zval而不是重新分配。&引用赋值时,原变量的is_ref 变为1,refcount 加1. 如果给一个变量&赋值,之前 = 赋值的变量会分配空间。
- <?php
- $a = 1;
- xdebug_debug_zval('a');
- echo PHP_EOL;
- $b = $a;
- xdebug_debug_zval('a');
- echo PHP_EOL;
- $c = &$a;
- xdebug_debug_zval('a');
- echo PHP_EOL;
- xdebug_debug_zval('b');
- echo PHP_EOL;
结果如下:
a:(refcount=1, is_ref=0),int 1
a:(refcount=2, is_ref=0),int 1
a:(refcount=2, is_ref=1),int 1
b:(refcount=1, is_ref=0),int 1
五、PHP7.X 标量在zval容器例子
- <?php
- $a = 1;
- xdebug_debug_zval('a');
- echo PHP_EOL;
- $b = $a;
- xdebug_debug_zval('a');
结果如下:可以看到标量(布尔,字符串,整形,浮点型)不再计数了
六、PHP5.3复合类型数组和对象在zval容器例子
- <?php
- $a = array( 'meaning' => 'life', 'number' => 42 );
- xdebug_debug_zval( 'a' );
- echo PHP_EOL;
- class Test{
- public $a = 1;
- public $b = 2;
- function handle(){
- echo 'hehe';
- }
- }
- $test = new Test();
- xdebug_debug_zval('test');
结果如下:可以看出,数组用了比数组长度多1个zval存储。数组分配了三个zval容器:a meaning number
a:(refcount=1, is_ref=0),
- array
- 'meaning' => (refcount=1, is_ref=0),
string
- 'life' (length=4)
- 'number' => (refcount=1, is_ref=0),
int
- 42
test:(refcount=1, is_ref=0),
- object(Test)[1]
- public 'a' => (refcount=2, is_ref=0),
int
- 1
- public 'b' => (refcount=2, is_ref=0),
int
- 2
七、PHP7.X复合类型数组和对象在zval容器例子
- <?php
- $a = array( 'meaning' => 'life', 'number' => 42 );
- xdebug_debug_zval( 'a' );
- echo PHP_EOL;
- class Test{
- public $a = 1;
- public $b = 2;
- function handle(){
- echo 'hehe';
- }
- }
- $test = new Test();
- xdebug_debug_zval('test');
结果如下:可以明显的看到数组a的refcount=2,后经测试发现数组的refcount都是从2开始的
八、循环引用问题
1、PHP7.1效果
- <?php
- $a = array('life');
- xdebug_debug_zval( 'a' );
- echo PHP_EOL;
- $a[] = &$a;
- xdebug_debug_zval('a');
- 可以看到,箭头方向表示的就是递归循环引用了
2、再看看5.3的效果
- 说明:在5.2及更早版本的PHP中,没有专门的垃圾回收器GC(Garbage Collection),引擎在判断一个变量空间是否能够被释放的时候是依据这个变量的zval的refcount的值,
如果refcount为0,那么变量的空间可以被释放,否则就不释放,这是一种非常简单的GC实现。现在unset ($a),那么array的refcount减1变为1.现在无任何变量指向这个zval,
而且这个zval的计数器为1,不会回收。- 结果:尽管不再有某个作用域中的任何符号指向这个结构(就是变量容器),由于子元素“1”仍然指向数组本身,所以这个容器不能被清除 。
因为没有另外的符号指向它,用户没有办法清除这个结构,结果就会导致内存泄漏。- 在php5.3的GC中,针对的垃圾做了如下说明:
- 1:如果一个zval的refcount增加,那么此zval还在使用,肯定不是垃圾,不会进入缓冲区
- 2:如果一个zval的refcount减少到0, 那么zval会被立即释放掉,不属于GC要处理的垃圾对象,不会进入缓冲区。
- 3:如果一个zval的refcount减少之后大于0,那么此zval还不能被释放,此zval可能成为一个垃圾,将其放入缓冲区。PHP5.3中的GC针对的就是这种zval进行的处理。
- 开启/关闭:垃圾回收机制可以通过修改php配置实现,也可以在程序中使用gc_enable() 和 gc_disable()开启和关闭。
九、垃圾回收算法
- 1、对每个根缓冲区中的根zval按照深度优先遍历算法遍历所有能遍历到的zval,并将每个zval的refcount减1,同时为了避免对同一zval多次减1(因为可能不同的根能遍历到同一个zval),
每次对某个zval减1后就对其标记为“已减”。- 2、再次对每个缓冲区中的根zval深度优先遍历,如果某个zval的refcount不为0,则对其加1,否则保持其为0。
- 3、清空根缓冲区中的所有根(注意是把这些zval从缓冲区中清除而不是销毁它们),然后销毁所有refcount为0的zval,并收回其内存。
- 如果不能完全理解也没有关系,只需记住PHP5.3的垃圾回收算法有以下几点特性:
- 1、并不是每次refcount减少时都进入回收周期,只有根缓冲区满额后在开始垃圾回收。
- 2、可以解决循环引用问题。
- 3、可以总将内存泄露保持在一个阈值以下。
以上就是全部内容了