6.1 一切皆对象
6.2 属性管理
6.3 我是风儿,我是沙
6.4 内存管理
6.1
.运算符
。如果用dir(lisy)调查list的属性,能看到一个属性是_add_,从样式上看,_add_是特殊方法,它特殊,在这个方法定义了"+"运算符对于对象的意义,两个list的对象相加时会进行合并列表的操作。
print([1,2,3] + [5,6,9]) #得到[1, 2, 3, 5, 6, 9]
print("abc" +"xyz") #连接字符串,获得"abcxyz"
实际上执行了如下的操作:
print("abc".__add__("xyz"))
运算符,比如+,-,>,<,and, or等都是通过特殊方法实现的,比如:
__mul__ :*
__or__: or
🔺:列表在python中是不可以相减的,如下,则会显示运行错误
我们可以创建一个列表的子类,通过增加__sub__()方法,来添加减法操作的定义
.元素的引用
常用方式
实际上程序运行:
此外,还有其他方法,比如:
__setitem__(x, y) #把下标为x的元素换为y
__delitem__(x) #删除下标为x的元素
__delitem__("x") #对于词典来说,删除键为“a”的元素
.内置函数的实现
与运算符类似,许多内置函数也都是调用对象的特殊方法。比如:
其它常用方法:
__abs__() #返回数字的绝对值
__int__() #取整数部分,往小取整
6.2 属性管理
.属性覆盖的背后
。__dict__属性: 一个类或对象拥有的属性会记录在__dict__中,并以词典形式表示出来,键为属性名,值为对应的属性。python在寻找对象的属性时,会按照继承关系依次寻找
例子:
输出结果:
输出顺序是按照一下与summer对象的亲近关系排列的,第一部分为summer对象自身的属性,也就是age。第二部分chicken类的属性,比如fly和__init__()方法。第三部分为Bird类的属性,比如feather,负责。最后一部分属于object类,有诸如,__doc__之类的属性
可以使用内置函数dir来查看对象summer对象的属性
对象的属性是分层管理的,summer能接触到的所有属性,分别存在summer,Chicken,Bird,object这四层,然后我们需要调用某个属性的时候,Python会一层层向下遍历,直到找到那个属性,由于对象不需要重复存储其祖先类的属性,所以分层管理的机制可以节省存储空间。
某个属性可能在不同层被重复定义,Python在向下遍历的过程中,会选取先遇到的那一个。这也是属性覆盖的原理,如果从summer调用chirp()方法,那么使用的将是和对象summer关系更近的Chicken的版本,而不是Bird的版本。即子类的属性比父类的同名属性有优先权,这是属性覆盖的关键。
如果进行赋值,那么python就不会分层深入查找了。比如:
尽管autumn修改了feather的属性值,但他并没有影响到Bird的类属性。
也可以不依赖继承关系,直接去操作某个祖先类的属性,比如:
实际上,相当于修改Bird的__dict__: Bird.__dict__["feather"] = 3,但是直接进行如下修改是不行的
同一个对象的不同属性之间可能存在依赖关系,当某个属性的修改,使我们希望依赖于该属性的其他属性也同时变化。Python提供了多种即时生产属性的方法,其中一种称为特性(property),特性使用内置函数property()来创建,最多可以加载四个参数,前三个参数为函数,分别用于设置,获取,修改和删除特性时,Python应该执行的操作,最后一个参数为特性的文档,可以为一个字符串,起的是说明的作用,例子如下:
.__getattr__()方法
用__getattr__(self, name)来查询即时生成的属性。当我们调用对象的一个属性时,如果通过__dict__机制,无法找到该属性。那么python就会调用对象的__getattr__()方法,来即时生成该属性。此外,即时生成属性还有其他的方法,比如使用descriptor类。
.6.3 我是风儿,我是沙
。动态类型,python的变量不需要声明,在赋值时,变量可以重新复制为其他任意值,这就是动态类型的体现。
通过内置函数id(),我们能查看到引用指向的是哪个对象,这个函数能返回对象的编号,也就是f返回对象的内存地址。
一个类可以有多个相等的对象,比如两个长字符可以是不同的对象,但他们的值可以相等。我们可以用is运算来判断两个引用是否指向同一个对象
改变一个引用,并不会影响其他引用的指向,从效果上看,就是各个引用各自独立,互不影响。如:
但注意以下情况:
在操作列表时,如果通过元素引用改变了某个元素,那么列表对象自身会发生改变,列表这种自身能发生改变的对象称为可变对象(Mutable Object),我们之前见过的词典也是可变对象。但整数,浮点数和字符串,则不能改变对象本身,赋值最多只能改变引用的指向,这种对象称为不可变对象。
。从动态类型看函数的参数传递
函数参数的传递,本质上传递的是引用,比如:
如果a是不可变对象,那么引用a和x之间相互独立,即对参数x的操作并不会影响到引用a。
但如果传递的是可变对象,情况就发生了变化,如下:
.内存管理
我们可以使用标准库中sys包中的getrefcount(),来查看某个对象的引用计数。需要注意的是,当把某一引用传递给getrefcount()时,参数实际上是创建了一个临时的引用,因此,getrefcount()所得到的结果会比期望的多1。
两个对象可能相互引用,构成引用环(Reference Cycle)
即使是单个对象,只需自己引用自己,也能构成引用环。
某个对象的引用计数可能减少,比如使用del关键字删除某个引用,如果某个引用指向对象a,那么当这个引用被重新定向到其他某个对象时,对象a的计数将减少
。垃圾回收
当Python的某个对象的引用计数降为0,即没有任何引用指向该对象时,该对象就要成为被回收的垃圾了。
当Python运行时,会记录其中分配对象和取消分配对象的次数。当两者的差值高于某个阈值时,垃圾回收才会启动,可以通过gc模块的get_threshold()方法,查看该阈值
import gc
print(gc.get_threshold()) #返回(700, 10, 10)
返回(700, 10, 10),后面的两个10是与分代回收相关的阈值,700即垃圾回收启动的阈值可以通过gc中的set_threshold()方法重新设置。当然也可以手动启动垃圾回收,即使用gc.collect()。python除了基础回收方式外,Python同时还采用了分代回收的策略。所以策略的基本假设是存活时间越久,对象越不可能在后面的程序中变成垃圾,对这样一些“长寿”对象,我们相信它们还有用处,所以减少在垃圾回收中扫描它们的频率。
Python将所有的对象分为0,1,2三代,所有的新建对象都是0代对象。当某一代对象经过垃圾回收依然存活,那它就会归入下一代对象,垃圾回收启动时一定会扫描所有的0代对象,如果0代经过一定次数的垃圾回收,就会启动对0代和1代的扫描清理,当1代也经历了一定次数的垃圾回收后,就会启动对0,1,2代的扫描,也就是对所有对象进行扫描。返回的(700, 10, 10) 也就是说,每10次0代垃圾回收会配合1次1代的垃圾回收,而每10次1代圾回收,才会有1次2代的垃圾回收。同样可以通过gc中的set_threshold()方法来调整次数,比如对2代对象进行更频繁的扫描,如:
import gc
gc.set_threshold(700,10,5) #调整次数,对2代对象进行更频繁的扫描
print(gc.get_threshold())
。孤立的引用环
引用环的存在给上面的垃圾回收机制带来很大的困难,这些引用环可能构成无法使用,但上面的计数不为0的一些对象:
a = []
b = [a]
a.append(b)
del a
del b
删了a,b引用之后,这两个对象不可能再从程序中调用,也就没有什么用处,但是由于引用环的存在,两个对象的引用计数都没有降到零,所以不会被垃圾回收。
为了回收引用环,Python会复制每个对象的引用计数,可以记为gc_ref。假设,每个对象i,该计数为gc_ref_i。Python会便利所有的对象i,对于每个对象i所引用的对象j,将相应的gc_ref_j减1,在结束遍历后,gc_ref不为0的对象和这些对象引用的对象以及继续更下游引用的对象,需要被保留,而其他对象则被垃圾回收。
代码地址:https://gitee.com/mabingqi/learn_programming_from_python/tree/master/