本书1-5章讲的是python中的对象,对应于源码objects目录中的内容。第1章是最基本的对象,第2章是整数对象,第3章是字符串对象,第4章是列表对象,第5章是字典对象。这5章中,基本对象、列表变化不大;2中的整数和长整数在3中间进行了合并;字符串和Unicode字符串在3中进行了合并;而字典对象则采用了新的实现,以提高性能表现。2与3的差别对应1-4章的内容如下:
第1章
第1章讲的是python中的对象。
3里面的PyObject对象没有变,但宏定义和2不同。3中是先定义了PyObject结构体,然后将一个结构体的对象定义为PyObject_HEAD宏。每次使用这一宏时,相当于定义了一个PyObject成员。
3中整数的基本类型是long类型,这一对象_longobject在longintrepr.h中定义。由于长整数类型支持任意长的整数,因此也是一个变长类型,使用了PyObject_VAR_HEAD。
类型对象没有什么变化。
第2章
第2章介绍的是Python2中的Int类型。
在Python3中,Int类型被取消,基本的整数类型成了Long类型,因此有很多地方是不同的。
最主要的变化是:1,长整型是一个变长的对象。2,取消了原来的整数池。
具体来看看这一章的内容。
首先Long类型的头文件不止longobject.h一个,还有一部分内容在longintrepr.h中,比如_longobject这一结构体的定义。
PyIntObject是一个固定大小的对象,在PyObject_HEAD后就是这一对象对应的数值,以ob_ival存储。而PyLongObject则是一个变长对象,在PyObject_VAR_HEAD后是一个数组,用来存储这一对象对应的数值。对应的运算如Long_Compare,与Int对象有所不同。
小整数对象的优化在python3中也得到了保留。
在一个整数对象生成时,会判断这个数的数值是否在小整数的范围之内,如果是一个小整数,则直接引用小整数对象,而不用重新生成对象。
而通用整数池则在Python3中得到了取消。2中的通用整数池技术,使得整数占用的空间一经分配就不会释放。
而Python3中取消了这一技术,则整数在使用完之后空间会得到释放。这一点可能用任务管理器来直接观察。
运行下面的代码,每一步的内存变化如表:
内存占用情况
可以看到,在生成出了这些整数对象之后,python2中整数占用的空间并没有被回收,而3中则得到了回收。
而最后一段的代码修改,因为整数池已经不复存在,因此这里只修改代码输出对应的内存位置。
只需要在long_to_decimal函数中加入
printf("address @%d\n", &aa);
即可。
运行结果如下图
第3章
Python2中的str类型已如书中所述。
2中的unicode类型与str类型类似,其类型定义为:
typedef struct {
PyObject_HEAD
Py_ssize_t length; /* Length of raw Unicode data in buffer */
Py_UNICODE *str; /* Raw Unicode buffer */
long hash; /* Hash value; -1 if not set */
PyObject *defenc; /* (Default) Encoded version as Python
string, or NULL; this is used for
implementing the buffer protocol */
} PyUnicodeObject;
Intern机制,即字符串共享机制。这一部分JAVA中也有,3中与2中机制相同。
字符串的连接部分,string_join对应的部分在_PyUnicode_JoinArray中。
字符串对象的生成机制较为复杂,因为涉及到编码与解码过程,这一部分在codec中,不完全算是对象的一部分。
第4章
list与2中基本一样。
设置新值并对旧值解引用的部分在3中用一个宏表示。
这个宏的定义在object.h中。
Py_SETREF采用Py_DECREF解引用,Py_XSETREF采用Py_XDECREF解引用。