Python基础知识点拾遗

浮点数

系统浮点数信息

1.完整信息

import sys
sys.float_info

显示结果为：

sys.float_info(max=1.7976931348623157e+308, max_exp=1024, max_10_exp=308, min=2.2250738585072014e-308, min_exp=-1021, min_10_exp=-307, dig=15, mant_dig=53, epsilon=2.220446049250313e-16, radix=2, rounds=1)

2.浮点数能表示的最大值

In [41]: sys.float_info.max
Out[41]: 1.7976931348623157e+308

3.浮点数能表示的最近接0的值

In [42]: sys.float_info.min
Out[42]: 2.2250738585072014e-308

4.浮点数的精度

In [43]: sys.float_info.epsilon
Out[43]: 2.220446049250313e-16

浮点数整除

浮点数整除，包括整数整除，返回的是比结果小的最大整数值，如：

In [54]: 12.3 / 5.2
Out[54]: 2.3653846153846154

In [55]: 12.3 // 5.2
Out[55]: 2.0

In [57]: 12.3 / -4
Out[57]: -3.075

In [58]: 12.3 // -4
Out[58]: -4.0

format

使用{:10}.format时，字符串与数字的输出是不一样的，如下：

In [126]: '{:10}'.format('9') #字符串
Out[126]: '9         '

In [127]: '{:10}'.format(9) #数字
Out[127]: '         9'

同样是占用了10个字符间隔，字符串默认在间隔的左边，数字默认在间隔的右边。如果想主动控制左或者右，可以使用<或者>符号，如：

In [128]: '{:>10}'.format('9') #字符串
Out[128]: '         9'

In [129]: '{:<10}'.format(9) #数字
Out[129]: '9         '

print函数中使用f模式的黑魔法。
在以下示例中感受下print(f'<str>')的作用。

In [153]: a = list(range(10))

In [158]: print('The sum of list a is {sum(a)}')  # 没有在f模式下打印
The sum of list a is {sum(a)}

In [157]: print(f'The sum of list a is {sum(a)}') # f模式下打印
The sum of list a is 45

In [156]: print(f'The sum of list a is sum(a)') # f模式下，sum(a)必须加上花括号，否则无效果
The sum of list a is sum(a)

字符串

字符串的可变性

大家都知道，python中，字符串是不可变的。但是，使用bytearray方法，实现了字符串的可变性。

In [47]: s = bytearray('abcde'.encode()) # 注意，在python3中此处必须对字符串进行编码，否则会报错；在python2中则不需要。

In [48]: s[1:3] = b'12'

In [49]: s
Out[49]: bytearray(b'a12de')

集合set

set的对称差symmetric_difference

集合a和b的对称差，返回在a或者b中，但是不同时在a和b中的元素组成的集合。可以用方法a.symmetric_difference(b)或者a^b实现。如：

In [83]: a = {1, 2, 3, 4}

In [84]: b = {3, 4, 5, 6}

In [85]: a.symmetric_difference(b)
Out[85]: {1, 2, 5, 6}

In [86]: b.symmetric_difference(a)
Out[86]: {1, 2, 5, 6}

In [87]: a ^ b
Out[87]: {1, 2, 5, 6}

update方法向集合中添加多个元素

通常，集合的add方法一次只能添加一个元素，update方法可以一次添加多个元素。

In [88]: a
Out[88]: {1, 2, 3, 4}

In [89]: b
Out[89]: {3, 4, 5, 6}

In [90]: a.update(b)

In [91]: a
Out[91]: {1, 2, 3, 4, 5, 6}

discard方法删除集合元素

通常，删除集合元素常用remove或者pop方法，remove方法删除不存在的集合元素时会报错，pop方法不能添加参数，只能随机删除集合元素。使用discard方法能够删除指定元素，若元素不存在时，则不会报错。如：

In [92]: a
Out[92]: {1, 2, 3, 4, 5, 6}

In [93]: a.remove(66)  # 删除不存在的元素报错
---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-93-db688143db2a> in <module>()
----> 1 a.remove(66)

KeyError: 66

In [97]: a
Out[97]: {1, 2, 3, 4, 5, 6}

In [98]: a.pop() # 随机删除元素
Out[98]: 2

In [99]: a
Out[99]: {1, 3, 4, 5, 6}

In [100]: a.discard(4) # 删除元素4

In [101]: a
Out[101]: {1, 3, 5, 6}

In [103]: print(a.discard(66)) # 删除不存在的元素不报错
None

difference与difference_update方法

集合a与集合b的difference方法返回只在a不在b中元素的集合，不会改变a或者b中的元素。difference_update方法从a中删除所有属于b的方法，此时集合a将被改变。如：

In [116]: a
Out[116]: {1, 2, 3, 4}

In [117]: b
Out[117]: {3, 4, 5, 6}

In [118]: a.difference(b)
Out[118]: {1, 2}

In [119]: a - b # 等同于a.difference(b)
Out[119]: {1, 2}

In [120]: b.difference(a)
Out[120]: {5, 6}

In [121]: b - a
Out[121]: {5, 6}

In [122]: a.difference_update(b) # 此时从a中删除了a与b共有的{3, 4}

In [123]: a
Out[123]: {1, 2}

内存地址

先看如下两段有趣的代码：

In [129]: x  = 2

In [130]: id(x)
Out[130]: 4350212208

In [131]: y = 2

In [132]: id(y)
Out[132]: 4350212208

In [133]: x is y
Out[133]: True

此时，x和y在内存中的地址是一样的，即x就是y。再看下面的代码：

In [134]: x = 500

In [135]: id(x)
Out[135]: 4384073168

In [136]: y = 500

In [137]: id(y)
Out[137]: 4384073456

In [138]: x is y
Out[138]: False

此时，x和y在内存中的地址是不一样的。为什么会出现如此奇怪的现象？原来，python会为每个出现的对象在内存中分配地址，一般来说，就算值相同，内存地址也不相同（如第二段代码中的x=500, y=500)。但是，为了提高内存利用效率，对于一些简单的对象，python采用了重用对象内存的方法（如第一段代码中的x=2, y=2)。

操作系统分隔符

当前操作系统的换行符

In [42]: os.linesep
Out[42]: '\n' # windows为\r\n

当前操作系统的路径分隔符

In [43]: os.sep
Out[43]: '/' # windows为'\'

当前操作系统环境变量的分隔符

In [44]: os.pathsep
Out[44]: ':' # windows为';'

字典

往字典中的键添加值

有时，需要往字典中的同一个键添加不同的值，一种有效率的方法如下：

dict.setdefault(key, default)

In [10]: data = {}

In [11]: data.setdefault('names', [])
Out[11]: []

In [12]: data
Out[12]: {'names': []}

In [16]: data.setdefault('names', []).append('Ruby')

In [17]: data
Out[17]: {'names': ['Ruby']}

In [18]: data.setdefault('names', []).append('Python')

In [19]: data
Out[19]: {'names': ['Ruby', 'Python']}

同样的功能，还可以有一种更高效的方法实现，采用collections模块中的defaultdict实现。

In [27]: from collections import defaultdict

In [28]: s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]

In [31]: d = defaultdict(list)

In [32]: d
Out[32]: defaultdict(list, {})

In [34]: for k, v in s:
    ...:     d[k].append(v)
    ...:     

In [35]: d
Out[35]: defaultdict(list, {'blue': [2, 4], 'red': [1], 'yellow': [1, 3]})

In [36]: d.items()
Out[36]: dict_items([('yellow', [1, 3]), ('blue', [2, 4]), ('red', [1])])

In [40]: d['blue']
Out[40]: [2, 4]

In [41]: d['blue'].append('gua')

In [42]: d
Out[42]: defaultdict(list, {'blue': [2, 4, 'gua'], 'red': [1], 'yellow': [1, 3]})

time

将时间戳转换成时间

现有秒级的时间戳数据，转化为时间需要如下两步：

利用localtime()函数将时间戳转化成localtime的格式
利用strftime()函数重新格式化时间

示例：

import time

timestamp = 1462451334

#转换成localtime
time_local = time.localtime(timestamp)
#转换成新的时间格式(2016-05-05 20:28:54)
dt = time.strftime("%Y-%m-%d %H:%M:%S",time_local)

Python基础知识点拾遗