浮点数
系统浮点数信息
1.完整信息
import sys
sys.float_info
显示结果为:
sys.float_info(max=1.7976931348623157e+308, max_exp=1024, max_10_exp=308, min=2.2250738585072014e-308, min_exp=-1021, min_10_exp=-307, dig=15, mant_dig=53, epsilon=2.220446049250313e-16, radix=2, rounds=1)
2.浮点数能表示的最大值
In [41]: sys.float_info.max
Out[41]: 1.7976931348623157e+308
3.浮点数能表示的最近接0的值
In [42]: sys.float_info.min
Out[42]: 2.2250738585072014e-308
4.浮点数的精度
In [43]: sys.float_info.epsilon
Out[43]: 2.220446049250313e-16
浮点数整除
浮点数整除,包括整数整除,返回的是比结果小的最大整数值,如:
In [54]: 12.3 / 5.2
Out[54]: 2.3653846153846154
In [55]: 12.3 // 5.2
Out[55]: 2.0
In [57]: 12.3 / -4
Out[57]: -3.075
In [58]: 12.3 // -4
Out[58]: -4.0
format
使用{:10}.format
时,字符串与数字的输出是不一样的,如下:
In [126]: '{:10}'.format('9') #字符串
Out[126]: '9 '
In [127]: '{:10}'.format(9) #数字
Out[127]: ' 9'
同样是占用了10个字符间隔,字符串默认在间隔的左边,数字默认在间隔的右边。如果想主动控制左或者右,可以使用<
或者>
符号,如:
In [128]: '{:>10}'.format('9') #字符串
Out[128]: ' 9'
In [129]: '{:<10}'.format(9) #数字
Out[129]: '9 '
print函数中使用f模式的黑魔法。
在以下示例中感受下print(f'<str>')
的作用。
In [153]: a = list(range(10))
In [158]: print('The sum of list a is {sum(a)}') # 没有在f模式下打印
The sum of list a is {sum(a)}
In [157]: print(f'The sum of list a is {sum(a)}') # f模式下打印
The sum of list a is 45
In [156]: print(f'The sum of list a is sum(a)') # f模式下,sum(a)必须加上花括号,否则无效果
The sum of list a is sum(a)
字符串
字符串的可变性
大家都知道,python中,字符串是不可变的。但是,使用bytearray
方法,实现了字符串的可变性。
In [47]: s = bytearray('abcde'.encode()) # 注意,在python3中此处必须对字符串进行编码,否则会报错;在python2中则不需要。
In [48]: s[1:3] = b'12'
In [49]: s
Out[49]: bytearray(b'a12de')
集合set
set的对称差symmetric_difference
集合a和b的对称差,返回在a或者b中,但是不同时在a和b中的元素组成的集合。可以用方法a.symmetric_difference(b)或者a^b实现。如:
In [83]: a = {1, 2, 3, 4}
In [84]: b = {3, 4, 5, 6}
In [85]: a.symmetric_difference(b)
Out[85]: {1, 2, 5, 6}
In [86]: b.symmetric_difference(a)
Out[86]: {1, 2, 5, 6}
In [87]: a ^ b
Out[87]: {1, 2, 5, 6}
update方法向集合中添加多个元素
通常,集合的add方法一次只能添加一个元素,update方法可以一次添加多个元素。
In [88]: a
Out[88]: {1, 2, 3, 4}
In [89]: b
Out[89]: {3, 4, 5, 6}
In [90]: a.update(b)
In [91]: a
Out[91]: {1, 2, 3, 4, 5, 6}
discard方法删除集合元素
通常,删除集合元素常用remove或者pop方法,remove方法删除不存在的集合元素时会报错,pop方法不能添加参数,只能随机删除集合元素。使用discard方法能够删除指定元素,若元素不存在时,则不会报错。如:
In [92]: a
Out[92]: {1, 2, 3, 4, 5, 6}
In [93]: a.remove(66) # 删除不存在的元素报错
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input-93-db688143db2a> in <module>()
----> 1 a.remove(66)
KeyError: 66
In [97]: a
Out[97]: {1, 2, 3, 4, 5, 6}
In [98]: a.pop() # 随机删除元素
Out[98]: 2
In [99]: a
Out[99]: {1, 3, 4, 5, 6}
In [100]: a.discard(4) # 删除元素4
In [101]: a
Out[101]: {1, 3, 5, 6}
In [103]: print(a.discard(66)) # 删除不存在的元素不报错
None
difference与difference_update方法
集合a与集合b的difference方法返回只在a不在b中元素的集合,不会改变a或者b中的元素。difference_update方法从a中删除所有属于b的方法,此时集合a将被改变。如:
In [116]: a
Out[116]: {1, 2, 3, 4}
In [117]: b
Out[117]: {3, 4, 5, 6}
In [118]: a.difference(b)
Out[118]: {1, 2}
In [119]: a - b # 等同于a.difference(b)
Out[119]: {1, 2}
In [120]: b.difference(a)
Out[120]: {5, 6}
In [121]: b - a
Out[121]: {5, 6}
In [122]: a.difference_update(b) # 此时从a中删除了a与b共有的{3, 4}
In [123]: a
Out[123]: {1, 2}
内存地址
先看如下两段有趣的代码:
In [129]: x = 2
In [130]: id(x)
Out[130]: 4350212208
In [131]: y = 2
In [132]: id(y)
Out[132]: 4350212208
In [133]: x is y
Out[133]: True
此时,x和y在内存中的地址是一样的,即x就是y。再看下面的代码:
In [134]: x = 500
In [135]: id(x)
Out[135]: 4384073168
In [136]: y = 500
In [137]: id(y)
Out[137]: 4384073456
In [138]: x is y
Out[138]: False
此时,x和y在内存中的地址是不一样的。为什么会出现如此奇怪的现象?原来,python会为每个出现的对象在内存中分配地址,一般来说,就算值相同,内存地址也不相同(如第二段代码中的x=500, y=500)。但是,为了提高内存利用效率,对于一些简单的对象,python采用了重用对象内存的方法(如第一段代码中的x=2, y=2)。
操作系统分隔符
当前操作系统的换行符
In [42]: os.linesep
Out[42]: '\n' # windows为\r\n
当前操作系统的路径分隔符
In [43]: os.sep
Out[43]: '/' # windows为'\'
当前操作系统环境变量的分隔符
In [44]: os.pathsep
Out[44]: ':' # windows为';'
字典
往字典中的键添加值
有时,需要往字典中的同一个键添加不同的值,一种有效率的方法如下:
dict.setdefault(key, default)
In [10]: data = {}
In [11]: data.setdefault('names', [])
Out[11]: []
In [12]: data
Out[12]: {'names': []}
In [16]: data.setdefault('names', []).append('Ruby')
In [17]: data
Out[17]: {'names': ['Ruby']}
In [18]: data.setdefault('names', []).append('Python')
In [19]: data
Out[19]: {'names': ['Ruby', 'Python']}
同样的功能,还可以有一种更高效的方法实现,采用collections模块中的defaultdict实现。
In [27]: from collections import defaultdict
In [28]: s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
In [31]: d = defaultdict(list)
In [32]: d
Out[32]: defaultdict(list, {})
In [34]: for k, v in s:
...: d[k].append(v)
...:
In [35]: d
Out[35]: defaultdict(list, {'blue': [2, 4], 'red': [1], 'yellow': [1, 3]})
In [36]: d.items()
Out[36]: dict_items([('yellow', [1, 3]), ('blue', [2, 4]), ('red', [1])])
In [40]: d['blue']
Out[40]: [2, 4]
In [41]: d['blue'].append('gua')
In [42]: d
Out[42]: defaultdict(list, {'blue': [2, 4, 'gua'], 'red': [1], 'yellow': [1, 3]})
time
将时间戳转换成时间
现有秒级的时间戳数据,转化为时间需要如下两步:
- 利用localtime()函数将时间戳转化成localtime的格式
- 利用strftime()函数重新格式化时间
示例:
import time
timestamp = 1462451334
#转换成localtime
time_local = time.localtime(timestamp)
#转换成新的时间格式(2016-05-05 20:28:54)
dt = time.strftime("%Y-%m-%d %H:%M:%S",time_local)