PHP作为“世界上最好的语言”,我们都知道php是弱类型语言,即在使用过程中,可以任意改变变量的类型。这对于代码中的灵活性有极大的方便。php底层是由c语言去实现的,那么c语言作为强类型语言,是怎么实现php的这些特性?
在php中变量的值由zval来表示
php7中的zval结构如下
struct _zval_struct {
zend_value value; /* value */
union {
struct {
ZEND_ENDIAN_LOHI_4(
zend_uchar type, //存储具体类型
zend_uchar type_flags,
zend_uchar const_flags,
zend_uchar reserved) /* call info for EX(This) */
} v;
uint32_t type_info;
} u1;
union {
uint32_t next; /* hash collision chain */
uint32_t cache_slot; /* literal cache slot */
uint32_t lineno; /* line number (for ast nodes) */
uint32_t num_args; /* arguments number for EX(This) */
uint32_t fe_pos; /* foreach position */
uint32_t fe_iter_idx; /* foreach iterator index */
uint32_t access_flags; /* class constant access flags */
uint32_t property_guard; /* single property guard */
uint32_t extra; /* not further specified */
} u2;
};
typedef union _zend_value {
zend_long lval; //整型
double dval; //浮点型
zend_refcounted *counted; //引用计数
zend_string *str; //字符串类型
zend_array *arr; //数组类型
zend_object *obj; //对象类型
zend_resource *res; //资源类型
zend_reference *ref; //引用类型
zend_ast_ref *ast; //抽象语法树
zval *zv; //zval类型
void *ptr; //指针类型
zend_class_entry *ce; //class类型
zend_function *func; //function类型
struct {
uint32_t w1;
uint32_t w2;
} ww;
} zend_value;
php 通过使用 zval中的type 去判断变量的类型,_zend_value联合体去查找对应类型的值。
在php7中,type的值可以为如下
type的类型可为如下
/* regular data types */
#define IS_UNDEF 0
#define IS_NULL 1
#define IS_FALSE 2
#define IS_TRUE 3
#define IS_LONG 4
#define IS_DOUBLE 5
#define IS_STRING 6
#define IS_ARRAY 7
#define IS_OBJECT 8
#define IS_RESOURCE 9
#define IS_REFERENCE 10
/* constant expressions */
#define IS_CONSTANT 11
#define IS_CONSTANT_AST 12
/* fake types */
#define _IS_BOOL 13
#define IS_CALLABLE 14
#define IS_ITERABLE 19
#define IS_VOID 18
/* internal types */
#define IS_INDIRECT 15
#define IS_PTR 17
#define _IS_ERROR 20
具体变量的表示
对于整型、浮点型、布尔和NULL,由于占用空间小,在zval中直接存储。
对于字符串、数组、资源类型和对象,php7重新对应的结构来装载数据。在_zend_value中存储对应结构的指针地址。
以下拿字符串来举例
在php7中字符串结构体定义如下
struct zend_string{
zend_refcounted_h gc;
zend_ulong h;
size_t len;
char val[1];
}
字段名 | 含义 |
---|---|
gc | 用于维护变量的垃圾回收 |
h | 冗余了hash值,避免在数组中操作中重复计算hash |
len | 记录字符串长度 |
val | val记录了字符串的内容,这里用了c的柔性数组 |
引用和赋值
- 赋值
对于整型、浮点型、布尔和NULL,由于占用空间小,在zval中直接存储。直接在进行赋值时,会创建2个zval。
字符串、数组、资源类型和对象会在赋值时,指向同一个value,等到变量的值被改变时,才会申请变量值的内存空间 - 引用
php7 中为引用多引入了一个新结构体
struct _zend_reference{
zend_refcounted_h gc;
zval val;
}
$a = '1234';//$a->zend_string(type=IS_STRING,recount_gc=1,is_ref_gc=0);
$c=$a;// $c,$a-> zend_string (type=IS_STRING,recount_gc=2,is_ref_gc=0);
$b=&$a;// $b,$a-> zval (type=IS_REFERENCE,recount_gc=2);
//$c-> zend_string (type=IS_STRING,recount_gc=2,);
在php7中,引入了zend_reference来处理。使得即使是引用 或者是赋值,在内存中只存有一份字符串
数组、对象和资源类型的赋值和引用与字符串类似。这里暂不讨论。
变量的作用域
全局变量
php中把定义在函数、类之外的变量称之为全局变量。包括include和require导入的代码。这些变量可以在函数和类的成员方法中通过global关键字引入。
全局变量保存在EG(symbol_table),这是一个哈希表。全局变量的访问是通过局部变量指向全局变量的方式进行访问的。
对于全局变量,ZEND内核有一个_zend_executor_globals结构,该结构中的symbol_table就是全局符号表, 其中保存了在顶层作用域中的变量。同样,函数或者对象的方法在被调用时会创建active_symbol_table来保存局部变量。 当程序在顶层中使用某个变量时,ZE就会在symbol_table中进行遍历, 同理,如果程序运行于某个函数中,Zend内核会遍历查询与其对应的active_symbol_table, 而每个函数的active_symbol_table是相对独立的,通过active_symbol_table指向symbol_table 从而取到全局变量的值。
变量的作用域是使用不同的符号表来实现的,于是顶层的全局变量在函数内部使用时, 需要先使用global语句来将变量“挪”到函数独立的*active_symbol_table中, 即变量的跨域操作。
局部变量
函数中的局部变量就存储在_zend_execute_data的symbol_table中,在执行当前函数的op_array时, 全局zend_executor_globals中的active_symbol_table会指向当前_zend_execute_data中的symbol_table。 因为每个函数调用开始时都会重新初始化EG(active_symbol_table)为NULL, 在这个函数的所有opcode的执行过程中这个全局变量会一直存在,并且所有的局部变量修改都是在它上面操作完成的,如前面的赋值操作等。 而此时,其他函数中的symbol_table会存放在栈中,将当前函数执行完并返回时,程序会将之前保存的zend_execute_data恢复, 从而其他函数中的变量也就不会被找到,局部变量的作用域就是以这种方式来实现的。