Python对象的拷贝

Python赋值操作或函数参数传递,传递的永远是对象引用(即内存地址),而不是对象内容。在Python中一切皆对象,对象又分为可变(mutable)和不可变(immutable)两种类型。对象拷贝是指在内存中创建新的对象,产生新的内存地址。当顶层对象和它的子元素对象全都是immutable不可变对象时,不存在被拷贝,因为没有产生新对象。浅拷贝(Shallow Copy),拷贝顶层对象,但不会拷贝内部的子元素对象。深拷贝(Deep Copy),递归拷贝顶层对象,以及它内部的子元素对象。

  • 可变对象与不可变对象
  • copy模块
  • 其它拷贝方法

一、可变对象与不可变对象

Python中一切皆对象,对象就像一个塑料盒子, 里面装的是数据。对象有不同类型,例如布尔型和整型,类型决定了可以对它进行的操作。现实生活中的"陶器"会暗含一些信息(例如它可能很重且易碎,注意不要掉到地上)。

对象的类型还决定了它装着的数据是允许被修改的变量(可变的mutable)还是不可被修改的常量(不可变的immutable)。你可以把不可变对象想象成一个透明但封闭的盒子:你可以看到里面装的数据,但是无法改变它。类似地,可变对象就像一个开着口的盒子,你不仅可以看到里面的数据,还可以拿出来修改它,但你无法改变这个盒子本身,即你无法改变对象的类型。

  • mutable : 可变对象,如List、Dict
  • immutable : 不可变对象,如Number、String、Tuple、Frozenset

注意: Python赋值操作或函数参数传递,传递的永远是对象引用(即内存地址),而不是对象内容

In [1]: a = 1

In [2]: b = a

In [3]: id(a)
Out[3]: 9164864

In [4]: id(b)
Out[4]: 9164864

In [5]: b += 1

In [6]: a
Out[6]: 1

In [7]: b
Out[7]: 2

In [8]: id(a)  # 对象引用a还是指向Number对象1
Out[8]: 9164864

In [9]: id(b)  # 对象引用b指向了Number对象2
Out[9]: 9164896

Python会缓存使用非常频繁的小整数-5至256、ISO/IEC 8859-1单字符、只包含大小写英文字母的字符串,以对其复用,不会创建新的对象:

1. 不会创建新对象
In [1]: a = 10

In [2]: b = 10

In [3]: id(a)
Out[3]: 9165152

In [4]: id(b)
Out[4]: 9165152

In [5]: a = '@'

In [6]: b = '@'

In [7]: id(a)
Out[7]: 139812844740424

In [8]: id(b)
Out[8]: 139812844740424

In [9]: a = 'HELLOWORLDhelloworld'

In [10]: b = 'HELLOWORLDhelloworld'

In [11]: id(a)
Out[11]: 139812785036792

In [12]: id(b)
Out[12]: 139812785036792
2. 会创建新的对象
In [1]: a = 1000

In [2]: b = 1000

In [3]: id(a)
Out[3]: 140528314730384

In [4]: id(b)
Out[4]: 140528314731824

In [5]: a = 'x*y'

In [6]: b = 'x*y'

In [7]: id(a)
Out[7]: 139897777405880

In [8]: id(b)
Out[8]: 139897777403808

In [9]: a = 'Hello World'

In [10]: b = 'Hello World'

In [11]: id(a)
Out[11]: 139897789146096

In [12]: id(b)
Out[12]: 139897789179568

二、copy模块

对象拷贝是指在内存中创建新的对象,产生新的内存地址。

  • 浅拷贝只拷贝最外层对象,深拷贝还会递归拷贝内层对象
  • 无论是浅拷贝还是深拷贝,只拷贝mutable可变对象成为一个新对象,而immutable不可变对象还是原来的那个
  • 当顶层对象和它的子元素对象全都是immutable不可变对象时,因为没有产生新对象,所以不存在被拷贝

2.1浅拷贝

浅拷贝(Shallow Copy),拷贝顶层对象,但不会拷贝内部的子元素对象。
2.1.1. 顶层是mutable,子元素全是immutable
当顶层对象是mutable可变对象,但是它的子元素对象全都是immutable不可变对象时,如[1, 'world', 2]

① 创建列表对象并赋值给变量a

In [1]: a = [1, 'world', 2]

In [2]: [ id(item) for item in a ]
Out[2]: [9164864, 140104749066928, 9164896]

In [3]: id(a)
Out[3]: 140104759916040

② 导入copy模块,使用copy.copy()函数浅拷贝a,并赋值给变量b

In [4]: import copy

In [5]: b = copy.copy(a)

In [6]: b
Out[6]: [1, 'world', 2]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 140104749066928, 9164896]

In [8]: id(b)
Out[8]: 140104760027784

③ 修改变量a的子元素a[0] = 3,由于整数是不可变对象,所以并不是修改1变为3,而是更改a[0]指向对象3

In [9]: a[0] = 3

In [10]: a
Out[10]: [3, 'world', 2]

In [11]: b
Out[11]: [1, 'world', 2]

In [12]: [ id(item) for item in a ]
Out[12]: [9164928, 140104749066928, 9164896]

In [13]: [ id(item) for item in b ]
Out[13]: [9164864, 140104749066928, 9164896]

2.1.2. 顶层是mutable,子元素部分immutable

当顶层对象是mutable可变对象,但子元素也存在mutable可变对象时,如[1, 2, ['hello','world']]

① 浅拷贝copy.copy()只拷贝了顶层对象,没有拷贝子元素对象['hello','world'],即a[2]和b[2]指向同一个列表对象

In [1]: a = [1, 2, ['hello','world']]

In [2]: import copy

In [3]: b = copy.copy(a)

In [4]: id(a)
Out[4]: 139770596269064

In [5]: id(b)
Out[5]: 139770596639368

In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 139770596304840]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 139770596304840]

In [8]: [ id(item) for item in a[2] ]
Out[8]: [139770585378520, 139770585378408]

In [9]: [ id(item) for item in b[2] ]
Out[9]: [139770585378520, 139770585378408]

② 修改a[2][1] = 'china',则b[2][1] = 'china'

In [10]: a[2][1] = 'china'

In [11]: a
Out[11]: [1, 2, ['hello', 'china']]

In [12]: b
Out[12]: [1, 2, ['hello', 'china']]

In [13]: [ id(item) for item in a[2] ]
Out[13]: [139770585378520, 139770584993552]

In [14]: [ id(item) for item in b[2] ]
Out[14]: [139770585378520, 139770584993552]

2.1.3. 顶层是immutable,子元素全是immutable

当顶层对象是immutable不可变对象,同时它的子元素对象也全都是immutable不可变对象时,如(1, 2, 3)

In [1]: a = (1, 2, 3)

In [2]: import copy

In [3]: b =  copy.copy(a)

In [4]: id(a)
Out[4]: 139664680010016

In [5]: id(b)
Out[5]: 139664680010016

In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 9164928]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 9164928]

变量a与变量b指向的是同一个元组对象,没有拷贝

2.1.4. 顶层是immutable,子元素部分mutable

当顶层对象是immutable不可变对象时,但子元素存在mutable可变对象时,如(1, 2, ['hello','world'])

In [1]: a = (1, 2, ['hello','world'])

In [2]: import copy

In [3]: b = copy.copy(a)

In [4]: id(a)
Out[4]: 139650704096640

In [5]: id(b)
Out[5]: 139650704096640

In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 139650704068680]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 139650704068680]

In [8]: [ id(item) for item in a[2] ]
Out[8]: [139650692293328, 139650692293216]

In [9]: [ id(item) for item in b[2] ]
Out[9]: [139650692293328, 139650692293216]

In [10]: a[2][1] = 'china'

In [11]: a
Out[11]: (1, 2, ['hello', 'china'])

In [12]: b
Out[12]: (1, 2, ['hello', 'china'])

变量a与变量b指向的是相同的元组对象,并且a[2]与b[2]指向同一个列表,所以修改a[2][1]会影响b[2][1]

2.2. 深拷贝

深拷贝(Deep Copy),递归拷贝顶层对象,以及它内部的子元素对象

2.2.1. 顶层是mutable,子元素全是immutable

当顶层对象是mutable可变对象,但是它的子元素对象全都是immutable不可变对象时,如[1, 'world', 2]

In [1]: a = [1, 'world', 2]

In [2]: import copy

In [3]: b = copy.deepcopy(a)

In [4]: id(a)
Out[4]: 140664823442376

In [5]: id(b)
Out[5]: 140664823349192

In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 140664823391544, 9164896]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 140664823391544, 9164896]

In [8]: a[0] = 3

In [9]: a
Out[9]: [3, 'world', 2]

In [10]: b
Out[10]: [1, 'world', 2]

In [11]: [ id(item) for item in a ]
Out[11]: [9164928, 140664823391544, 9164896]

In [12]: [ id(item) for item in b ]
Out[12]: [9164864, 140664823391544, 9164896]

变量a与变量b指向不同的列表对象,修改a[0]只是将列表a的第一个元素重新指向新对象,不会影响b[0]

2.2.2. 顶层是mutable,子元素部分mutable

当顶层对象是mutable可变对象,但子元素也存在mutable可变对象时,如[1, 2, ['hello','world']]

In [1]: a = [1, 2, ['hello','world']]

In [2]: import copy

In [3]: b = copy.deepcopy(a)

In [4]: id(a)
Out[4]: 140531593252104

In [5]: id(b)
Out[5]: 140531593479304

In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 140531593299016]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 140531593324232]

In [8]: [ id(item) for item in a[2] ]
Out[8]: [140531582302896, 140531582302784]

In [9]: [ id(item) for item in b[2] ]
Out[9]: [140531582302896, 140531582302784]
In [10]: a[2][1] = 'china'

In [11]: a
Out[11]: [1, 2, ['hello', 'china']]

In [12]: b
Out[12]: [1, 2, ['hello', 'world']]

In [13]: [ id(item) for item in a[2] ]
Out[13]: [140531582302896, 140531581905808]

In [14]: [ id(item) for item in b[2] ]
Out[14]: [140531582302896, 140531582302784]
image.png

深拷贝既拷贝了顶层对象,又递归拷贝了子元素对象,所以a[2]与b[2]指向了两个不同的列表对象(但是列表对象的子元素初始指定的字符串对象一样),修改a[2][1] = 'china'后,它重新指向了新的字符串对象(内存地址为140531581905808),不会影响到b[2][1]

2.2.3. 顶层是immutable,子元素全是immutable

当顶层对象是immutable不可变对象,同时它的子元素对象也全都是immutable不可变对象时,如(1, 2, 3)

In [1]: a = (1, 2, 3)

In [2]: import copy

In [3]: b = copy.deepcopy(a)

In [4]: id(a)
Out[4]: 140021832303960

In [5]: id(b)
Out[5]: 140021832303960

In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 9164928]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 9164928]

变量a与变量b指向的是同一个元组对象,不存在拷贝

2.2.4. 顶层是immutable,子元素部分mutable

当顶层对象是immutable不可变对象时,但子元素存在mutable可变对象时,如(1, 2, ['hello','world'])

In [1]: a = (1, 2, ['hello','world'])

In [2]: import copy

In [3]: b = copy.deepcopy(a)

In [4]: id(a)
Out[4]: 140437037631672

In [5]: id(b)
Out[5]: 140437085244440

In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 140437036297096]

In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 140437036357960]

In [8]: [ id(item) for item in a[2] ]
Out[8]: [140437024839640, 140437024839528]

In [9]: [ id(item) for item in b[2] ]
Out[9]: [140437024839640, 140437024839528]

In [10]: a[2][1] = 'china'

In [11]: a
Out[11]: (1, 2, ['hello', 'china'])

In [12]: b
Out[12]: (1, 2, ['hello', 'world'])

In [13]: [ id(item) for item in a[2] ]
Out[13]: [140437024839640, 140437016189336]

In [14]: [ id(item) for item in b[2] ]
Out[14]: [140437024839640, 140437024839528]

变量a与变量b指向的是不同的元组对象,同时a[2]与b[2]指向不同的列表对象,所以修改a[2][1]不会影响b[2][1]

3. 其它拷贝方法

3.1. 列表的复制

In [1]: a = [1, 2, 3]

In [2]: b = a

In [3]: b
Out[3]: [1, 2, 3]

In [4]: a[0] = 'wangy'

In [5]: a
Out[5]: ['wangy', 2, 3]

In [6]: b
Out[6]: ['wangy', 2, 3]

使用=是赋值,即将列表对象的引用也赋值给变量b,可以将列表对象想像成一个盒子,变量a相当于这个盒子上的标签,执行b = a后,相当于再在这个盒子上贴上b标签,a和b实际上指向的是同一个对象。因此,无论我们是通过a还是通过b来修改列表的内容,其结果都会作用于双方。

列表的复制都相当于浅拷贝效果,有以下三种方式:

  • 列表的copy()函数
  • list()转换函数
  • 列表分片[:]
In [1]: a = [1, 2, ['hello','world']]

In [2]: b = a.copy()

In [3]: c = list(a)

In [4]: d = a[:]

In [5]: id(a), id(b), id(c), id(d)
Out[5]: (140277244933640, 140277244846856, 140277323038536, 140277244767944)

In [6]: a[0] = 100

In [7]: a[2][1] = 'wangy'

In [8]: a
Out[8]: [100, 2, ['hello', 'wangy']]

In [9]: b
Out[9]: [1, 2, ['hello', 'wangy']]

In [10]: c
Out[10]: [1, 2, ['hello', 'wangy']]

In [11]: d
Out[11]: [1, 2, ['hello', 'wangy']]

b/c/d都是a的复制,它们都指向了不同的列表对象,但是没有拷贝子元素,a[2]和b[2]/c[2]/d[2]指向同一个列表,相当于浅拷贝的效果

3.2. 元组的复制

In [1]: a = (1, 2, ['hello','world'])

In [2]: b = a[:]

In [3]: id(a), id(b)
Out[3]: (140146192445512, 140146192445512)

In [4]: a
Out[4]: (1, 2, ['hello', 'world'])

In [5]: b
Out[5]: (1, 2, ['hello', 'world'])

In [6]: a[2][1] = 'wangy'

In [7]: a
Out[7]: (1, 2, ['hello', 'wangy'])

In [8]: b
Out[8]: (1, 2, ['hello', 'wangy'])

使用分片[:]操作,a和b其实是指向同一个元组,而且没有拷贝子元素,a[2]和b[2]也指向同一个列表,相当于浅拷贝的效果

3.3. 字典的复制

同列表类似,可以使用字典的copy()函数或者转换函数dict()

In [1]: a = {'name': 'wangy', 'age': 18, 'jobs': ['devops', 'dba']}

In [2]: b = a.copy()

In [3]: c = dict(a)

In [4]: id(a), id(b), id(c)
Out[4]: (139653533041504, 139653544192616, 139653533040712)

In [5]: a['age'] = 20

In [6]: a['jobs'].append('python')

In [7]: a
Out[7]: {'name': 'wangy', 'age': 20, 'jobs': ['devops', 'dba', 'python']}

In [8]: b
Out[8]: {'name': 'wangy', 'age': 18, 'jobs': ['devops', 'dba', 'python']}

In [9]: c
Out[9]: {'name': 'wangy', 'age': 18, 'jobs': ['devops', 'dba', 'python']}

变量a与变量b/c指向不同的字典,但是没有拷贝子元素,a['jobs']和b['jobs']/c['jobs']指定同一个列表,相当于浅拷贝的效果

3.4. 集合的复制

同列表类似,可以使用集合的copy()函数或者转换函数set()

In [1]: a = {1, 2, 3}

In [2]: b = a.copy()

In [3]: c = set(a)

In [4]: id(a), id(b), id(c)
Out[4]: (139965317888712, 139965317888936, 139965317889608)

In [5]: a.add('wangy')

In [6]: a
Out[6]: {1, 2, 3, 'wangy'}

In [7]: b
Out[7]: {1, 2, 3}

In [8]: c
Out[8]: {1, 2, 3}

变量a与变量b/c指向不同的集合,而集合的元素必须是hashable,所以修改集合a不会影响到b/c

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 230,825评论 6 546
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 99,814评论 3 429
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 178,980评论 0 384
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 64,064评论 1 319
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 72,779评论 6 414
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 56,109评论 1 330
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 44,099评论 3 450
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 43,287评论 0 291
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 49,799评论 1 338
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 41,515评论 3 361
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 43,750评论 1 375
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 39,221评论 5 365
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 44,933评论 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 35,327评论 0 28
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 36,667评论 1 296
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 52,492评论 3 400
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 48,703评论 2 380

推荐阅读更多精彩内容