在Python中对整数和浮点数进行数字计算是非常简单的,但是,如果需要对分数、数组或者日期和时间进行计算,就需要完成更多的工作;
1.对数值进行取整
问题:我们想将一个浮点数取整到固定的小数位;
解决方案:对于简单的取整操作,使用内建的round(value,ndigits)函数即可;
>>> round(1.234565,2)
1.23
2.执行精确的小数计算
问题:我们需要对小数进行精确计算,不希望因为浮点数天生的误差而带来影响
解决方案:如果期望得到更高的精度(并愿意为此牺牲一些性能),可以使用decimal模块;
>>> from decimal import Decimal
>>> a = Decimal('4.2')
>>> b = Decimal('2.1')
>>> a+b
Decimal('6.3')
>>> print(a+b)
6.3
decimal模块的主要功能时允许控制计算过程中的各个方面,这包括数字的维数和四舍五入。
3.对数值做格式化输出
问题:我们需要对数值做格式化输出,包括控制位数,对齐,包含千分位分隔符以及其他的一些细节;
解决方案:要对一个单独的数值做格式化输出,可以使用内建的format()函数;
>>> x = 123.45678
>>> format(x,'0.2f')
'123.46'
>>> format(x,'>10.1f')
' 123.5'
>>> format(x,'*>10.1f')
'*****123.5'
在很多的python代码中可以看到用%来格式化处理;
>>> '%0.2f' % x
'123.46'
4.同二进制、八进制、十六进制数打交道
问题:我们需要对二进制、八进制和十六进制表示的数值做转化或输出
解决方案:要将一个整数转换为二进制、八进制和十六进制的文本字符串形式,只要分别使用内建的bin(),oct() 和hex()函数即可;
5.从字节串中打包和解包大整数
问题:我们有一个字节串,需要将其解包为一个整型数值。此外,还需要讲一个大整数重新转换为一个字节串;
解决方案:要将字节解释为整数,可以使用int.from_bytes()方法;
要将一个大整数重新转化为字节串,可以使用int.to_bytes()方法;
6.复数运算
7.处理无穷大和NaN
问题:我们需要对浮点数和无穷大、负无穷大或NaN(not a number)进行判断;
解决方案:Python并没有特殊的语法来表示这些特殊的浮点数值,但是可以通过float()来创建。要检查出书否出现这些值;可以使用math.isinf()和math.isnan()函数
8.分数的计算
>>> from fractions import Fraction
>>> a = Fraction(5,4)
>>> b = Fraction(7,16)
>>> print(a+b)
27/16
>>> print(a*b)
35/64
>>> c = a * b
>>> c.numerator
35
>>> c.denominator
64
9.处理大型数组的计算
问题:我们需要对大型数据集比如数组或网格(grid)进行计算
解决方案:对于任何涉及数组的计算密集型任务,请使用Numpy库。Numpy的主要特性是为Python提供了数组对象;
>>> x = [1,2,3,4]
>>> y = [5,6,7,8]
>>> x*2
[1, 2, 3, 4, 1, 2, 3, 4]
>>> x + y
[1, 2, 3, 4, 5, 6, 7, 8]
>>> x + 10
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: can only concatenate list (not "int") to list
>>> #Numpy arrays
>>> import numpy as np
>>> ax = np.array([1,2,3,4])
>>> ay = np.array([5,6,7,8])
>>> ax * 2
array([2, 4, 6, 8])
>>> ax + 10
array([11, 12, 13, 14])
>>> ax + ay
array([ 6, 8, 10, 12])
>>> ax * ay
array([ 5, 12, 21, 32])
Numpy 提供了一些“通用函数”的集合,他们也能对数组进行操作,这些通用函数可作为math模块中所对应函数的替换。
>>> np.sqrt(ax)
array([ 1. , 1.41421356, 1.73205081, 2. ])
>>> np.cos(ax)
array([ 0.54030231, -0.41614684, -0.9899925 , -0.65364362])>>> np.sqrt(ax)
array([ 1. , 1.41421356, 1.73205081, 2. ])
>>> np.cos(ax)
array([ 0.54030231, -0.41614684, -0.9899925 , -0.65364362])
使用Numpy中的通用函数,其效率要比数组进行迭代然后使用math模块中的函数每次只处理一个元素快上百倍,因此,只要有可能就应该使用这些通用函数
>>> a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
>>> a
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12]])
>>> a[1]
array([5, 6, 7, 8])
>>> a[:,1]
array([ 2, 6, 10])
>>> a[1:3,1:3]
array([[ 6, 7],
[10, 11]])
>>> a
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12]])
>>> a + [100,101,102,103]
array([[101, 103, 105, 107],
[105, 107, 109, 111],
[109, 111, 113, 115]])
>>> np.where(a<10,a,10)
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 10, 10]])
10.矩阵和线性代数的计算
问题:我们需要执行矩阵和线性代数方面的操作,比如矩阵乘法,求行列式、解线性方程等。
解决方案:Numpy库中有一个matrix对象可用来处理这种情况。
更多关于Numpy或者matrix的资料参考Numpy(https://www.numpy.org)
11.随机选择
问题:我们想从序列中随机挑选出元素,或者生成随机数;
解决方案:random模块中有各种函数可用于需要随机数和随机选择的场景,例如random.choice():
>>> import random
>>> values = [1,2,3,4,5,6]
>>> random.choice(values)
2
>>> random.choice(values)
5
- 如果想取出N个元素,将选出的元素移除以做进一步的考察,可以使用random.sample():
>>> random.sample(values,2)
[6, 2]
>>> random.sample(values,2)
[6, 5]
>>> random.sample(values,3)
[1, 3, 2]
- 如果只是想在序列中原地打乱元素的顺序(洗牌),可以使用random.shuffle():
>>> random.shuffle(values)
>>> values
[3, 6, 4, 2, 1, 5]
>>> random.shuffle(values)
>>> values
[4, 3, 5, 6, 2, 1]
- 要产生随机整数,可以使用random.randint():
>>> random.randint(0,10)
5
>>> random.randint(0,10)
8
- 要产生0-1之间均分布的浮点数值,可以使用random.random():
>>> random.random()
0.9835000918969841
>>> random.random()
0.549302349076499
- random模块彩玉马特赛特旋转算法来计算随机数的,这是一个确定性的算法,但是可以通过random.seed()函数来修改初始的种子值。
random.seed() #系统默认的os.urandom()
random.seed(12345) #用户给定的种子值
random.seed(b'bytedata')
12.时间换算
问题:我们的代码需要进行简单的时间转换工作,比如将日转换为秒,将小时转换为分钟等;
解决方案:我们可以使用datetime模块来完成不同时间单位间的换算;
>>> from datetime import timedelta
>>> a = timedelta(days=2,hours=6)
>>> b = timedelta(hours = 4.5)
>>> c = a + b
>>> c.days
2
>>> c.seconds
37800
>>> c.seconds / 3600
10.5
>>> c.total_seconds() / 3600
58.5
- 我们需要表示特定的日期和时间,可以创建datetime实例并使用标准的数学运算来操作他们:
>>> from datetime import datetime
>>> a = datetime(2017,9,23)
>>> print(a + timedelta(days=10))
2017-10-03 00:00:00
>>> b = datetime(2017,12,21)
>>> d = b - a
>>> d.days
89
>>> now = datetime.today()
>>> print(now)
2018-03-07 10:03:39.843345
>>> print(now + timedelta(minutes = 10))
2018-03-07 10:13:39.843345
- 对于大部分基本的日期和时间操控问题,datetime模块已基本满足要求了。如果需要处理更为复杂的日期问题,比如处理时区、模糊时间范围,计算节日的日期等,可以尝试dateutil模块;
>>> from dateutil.relativedelta import relativedelta
>>> print(a)
2017-09-23 00:00:00
>>> a + relativedelta(months = + 1)
datetime.datetime(2017, 10, 23, 0, 0)
>>> a + relativedelta(months = + 4)
datetime.datetime(2018, 1, 23, 0, 0)
13.计算上周5的日期
14.找出当月的日期范围
问题:我们有一些代码需要循环迭代当月中的每个日期,我们需要一种高效的方法来计算出日期的范围;
解决方案:对日期进行循环迭代并不需要事先构建一个包含所有日期的列表,只需计算出范围的开始日期和结束日期,然后在迭代时利用datetime.timedelta对象来递增日期就可以;
>>> from datetime import datetime,date,timedelta
>>> import calendar
>>> def get_month_range(start_date = None):
... if start_date is None:
... start_date = date.today().replace(day=1)
... _,days_in_month = calendar.monthrange(start_date.year,start_date.month)
... end_date = start_date + timedelta(days = days_in_month)
... return (start_date,end_date)
...
>>> a_day = timedelta(days = 1)
>>> first_day,last_day = get_month_range()
>>> while first_day < last_day:
... print(first_day)
... first_day += a_day
...
2018-03-01
2018-03-02
2018-03-03
2018-03-04
2018-03-05
2018-03-06
...
2018-03-30
2018-03-31
15.将字符串转换为日期
问题:我们的应用程序接收到字符串形式的临时数据,但是我们想将这些字符串转换为datetime对象,以此对他们执行一些非字符串的操作;
解决方案:Python中的标准模块datetime是用来处理这种问题的简单方案;
>>> from datetime import datetime
>>> text = '2017-12-21'
>>> y = datetime.strptime(text,'%Y-%m-%d')
>>> y
datetime.datetime(2017, 12, 21, 0, 0)
>>> z = datetime.now()
>>> z
datetime.datetime(2018, 3, 7, 10, 21, 58, 139168)
>>> diff = z - y
>>> diff
datetime.timedelta(76, 37318, 139168)
datetime.strptime()方法支持许多格式化代码,比如%Y代表4为数字表示的年份……,值得一提的是datetime.strptime()的性能通常比我们想象的还要糟糕很多,这是因为该函数是用纯Python代码实现的,而且需要处理各种各样的系统区域设定;
datetime.timedelta(76, 37318, 139168)
>>> from datetime import datetime
>>> def parse_ymd(s):
... year_s,month_s,day_s = s.split('-')
... return datetime(int(year_s),int(month_s),int(day_s))
...
>>> parse_ymd(text)
datetime.datetime(2017, 12, 21, 0, 0)
通过测试,上面的函数比datetime.strptime()快了7倍多;如果需要处理大量的涉及日期的数据时,需要考虑此问题;