橡皮擦,一个逗趣的互联网高级网虫
牛年来了,滚雪球学 Python 第二轮开启,为了方便大家学习,先罗列一下第一遍滚雪球的所有博客吧。
滚雪球学 Python 文章
- 1.这才是 Python 学习的正确起手姿势,滚雪球学 Python
- 2. 无门槛学会数据类型与输入、输出函数,滚雪球学 Python
- 3. 无转折不编程,滚雪球学 Python
- 4. 列表一学完,Python 会一半,滚雪球学 Python
- 5. Python 循环的本质就是一段代码懒得重复写
- 6. Python 元组,不可变的列表,滚雪球学 Python
- 7. ✎ 会查新华字典不?会。Python 字典已经掌握了
- 8. ㊙ Python 集合三板斧,滚雪球学 Python
- 9. Python 学习过程的第一个山坡,99%的人都倒在了山坡下
- 10. 比找女朋友还难的技术点,Python 面向对象
- 11. 用别人写好的代码,完成我的工作,剩下的时间去摸鱼
- 12. 数据放在本地,心里才更踏实,滚雪球学 Python
- 13. 如果自己写的 Python 程序出错了,怎么办?
- 14. Python 与数据库那点事儿,滚雪球学 Python
- 15. Python 程序运行速度如何提高十倍?第一遍滚雪球学 Python 收工
当然在学习完这个系列之后,还为大家准备了一个番外篇。滚雪球学 Python 自动化篇,有兴趣的你也可以点点关注。
接下来就进入正题吧,滚雪球学 Python 第二轮将在第一轮的基础之后,对基础知识进行扩展,争取本系列的文章能让你收获新知识。
新的系列,让我们一起 Be More Pythonic
。
一、列表与元组那些事儿
1. 列表和元组为何要总放在一起
列表和元组在基础篇已经好好的研究了基础用法,你应该保留一个基本印象就是列表和元组,就是一个可以放置任意数据类型的有序集合,或者当成一个容器也可以。
它们两个最直接的区别就是,列表长度大小不固定,可变,元组长度大小固定,不可变。
在很多地方,会把这种区别叫做动态与静态。
这里最常见的一个错误就是给元组赋值或者修改值了,错误提示如下,出现了要知道原因是啥?
TypeError: 'tuple' object does not support item assignment
如何去给元组增加数据呢,我想你应该也比较清楚了,就是新创建一个元组,把新的数据和旧的数据一拼接,搞定。
# 梦想橡皮擦 专用的反爬虫注释
my_old_tuple = (1, 2, "a", "b")
my_new_tuple = ("c", "d")
my_tuple = my_old_tuple+my_new_tuple
print(my_tuple)
对于基础部分,还有要注意的就是,元组如果只有一个元素,一定要这么写 (1,)
,逗号不要遗漏,遗漏了括号里面是啥数据类型,最后得到的就是那个数据类型的数据了。
1.1 列表和元组的切片
列表和元组都是有序的,有序就能切片,而切片记住是顾头不顾尾的操作,例如下述代码。
my_tuple = my_old_tuple+my_new_tuple
print(my_tuple[1:3])
在刚学习切片的时候,一个比较常见的错误如下,该错误产生的原因是,[]
中括号里面的 :
写成其他符号了。
TypeError: tuple indices must be integers or slices, not tuple
1.2 负数索引与二者相互转换
列表与切片二者都支持负数索引取值,但是需要知道负数索引是从 -1
开始的,为啥?自己琢磨。
小声嘀咕:还不是因为 0 只有一个
二者也可以互相转换,转换应用的是内置的函数 list
和 tuple
,顺着函数学习下去,列表与元组都有一些可以应用的内置函数,这部分在滚雪球第一遍学习的时候,咱已经都搞定了,很简单的知识点。
1.3 列表与元组的存储方式
运行下述代码查看运行结果,列表与元组元素数目保持一致。
my_list = ["a", "b", "c"]
print(my_list.__sizeof__())
my_tuple = ("a", "b", "c")
print(my_tuple.__sizeof__())
输出的结果存在差异,相同元素数据的列表与元组,系统给列表分配的空间要大一些
64
48
第一个知识点是 __sizeof__()
: 表示的打印系统分配空间的大小。
接下来我们对其进行一下基本的测试,从列表检测系统分配是如何进行空间分配的。
my_list = []
print("初始化大小",my_list.__sizeof__())
my_list.append("a")
print("追加1个元素之后的大小",my_list.__sizeof__())
my_list.append("b")
print("追加2个元素之后的大小",my_list.__sizeof__())
my_list.append("c")
print("追加3个元素之后的大小",my_list.__sizeof__())
my_list.append("d")
print("追加4个元素之后的大小",my_list.__sizeof__())
my_list.append("e")
print("追加5个元素之后的大小",my_list.__sizeof__())
运行结果为:
初始化大小 40
追加1个元素之后的大小 72
追加2个元素之后的大小 72
追加3个元素之后的大小 72
追加4个元素之后的大小 72
追加5个元素之后的大小 104
增加一个元素之后,大小变成了 72,然后连续增加 4 个元素,系统分配的大小都没有变化,地 5 个元素,又增加了 32 字节空间,这样已经可以得到结论了:
列表会一次性的增加 4 个元素的空间,当空间使用完毕之后,才会继续增加。
上述代码的原理:
列表从本质上看,是一个动态的数组,列表中并不是存储的真实数据,而是每个元素在内存中的地址(引用),因为列表存储是元素的引用这个特性,所以引用占用的内存空间是相同的,也就是 8 个字节,并且这样可以存储不同类型的数据。
在 64 位的操作系统中,地址占用 8 个字节,如果你的电脑是 32 位,那地址占用的是 4 个字节,注意下即可。
1.4 列表和元组的应用场景
简单来说,元组用在固定元素内容的数据上,列表用在可变的数据上,在希望记忆的简单一些,可以直接记成如果只需要 2、3 个元素,就使用 tuple
,元素在多就使用 namedtuple
,它是一个函数。
使用 namedtuple
需要先进行导入。
from collections import namedtuple
help(namedtuple)
函数原型如下:
namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)
# Returns a new subclass of tuple with named fields.
先写一段测试代码:
from collections import namedtuple
Point = namedtuple('Point', ['x', 'y'])
p = Point(10, 20)
print(p.x)
print(p.y)
前面两个参数需要简单学习一下。
-
typename
:字符串类型的参数,这个参数理解起来比较绕,贴一下官方的解释,namedtuple()
会根据这个typename
, 创建一个子类类名返回出去,例如上文的测试代码中的Point
,创建好的类名称就是Point
,第二个参数就是以后的类属性了。 -
field_names
:用于为创建的元组的每个元素命名,可以传入列表或者元组,例如['a', 'b']
、(a,b)
,也可以传入'a b'
或'a,b'
这种被逗号或空格分割的单字符串。
上文中如果你希望看到类被构建的过程,可以增加参数 verbose
,但是这个参数在官网也有相关的说明,有的版本是不支持的,在 Python 3.7 之后就没有该属性了。
Changed in version 3.6: The verbose and rename parameters became keyword-only arguments.
Changed in version 3.6: Added the module parameter.
Changed in version 3.7: Removed the verbose parameter and the _source attribute.
Changed in version 3.7: Added the defaults parameter and the _field_defaults attribute.
初始化空列表是使用 list() 还是使用 []
该内容可以使用下述代码进行一下效率的测试。
import timeit
a = timeit.timeit('a=list()', number=10000000 )
b = timeit.timeit('a=[]', number=10000000 )
print(a)
print(b)
运行结果:
1.6634819
0.5888171999999998
结论是 []
速度更快,因为 list()
是函数调用,效率肯定要低一些。
有了上述函数,你也可以测试一下相同的元素在列表与元组初始化的时候,哪个效率更好。
import timeit
a = timeit.timeit('a=("a","b","c")', number=10000)
b = timeit.timeit('b=["a","b","c"]', number=10000)
print(a)
print(b)
运行结果如下:
# 初始化元组
0.0005571000000000048
# 初始化列表
0.002022099999999999
1.5 这篇博客的总结
这篇博客,重点回顾了列表与元组的一些基础内容,并且探究了一下列表与元组在系统分配上的差异,额外为大家扩展了一个 namedtuple
函数,最后你可以扩展了解一下 timeit
模块。
滚学球学 Python 再次开启,已有起点的拔高,为了更高级的目标,我们来啦。
相关阅读
如果你想跟博主建立亲密关系,可以关注同名公众号 <font color="red">梦想橡皮擦</font>,近距离接触一个逗趣的互联网高级网虫。
博主 ID:梦想橡皮擦,希望大家<font color="red">点赞</font>、<font color="red">评论</font>、<font color="red">收藏</font>。