range()和xrange()函数
- 在 python 2.x 版本中,同时存在range()和xrange()函数,其中,range()返回值是一个列表,xrange()返回值是一个迭代器;
- 在 python 3.x 版本中,取消了xrange()的定义,仅保留了range()函数,且range()函数的返回值也改为迭代器;
- xrange和range的语法格式相同;
- 语法:
- 格式1: range(stop)
- 格式2: range(start, stop[, step])
- 返回值:range 对象
- start表示起始值(正整数/负整数),stop表示终止值(正整数/负整数),step表示步进值(默认为1,正整数/负整数);
- 当输入参数只有stop时,起始值是0。
- 无论如何配置,返回值中均不包括stop值。
- 如果要将生成的range()对象变为列表就需要利用list(range(..))方式;
range()和np.arange()函数
- 生成的数据都是等差的;
- range()是python的内置函数,其返回值是range可迭代对象;
- arange()是Numpy库中的函数,其返回值是数组对象;
- 语法:
- 格式:np.arange([start,] stop[, step,], dtype=None)
- 仅输入stop值,此时start默认从0开始
- 在给定的范围内返回均匀间隔的值,其中step可以为小数;
- 该函数生产的数组范围是[start,stop),即不包括stop值;
- start表示起始值(默认为0,可正,可负,可小数),stop表示终止值(正/负数,可小数),step步进值(正/负数,可小数);
python random模块
random.random()
- 用于生成一个0到1的随机符点数: 0 <= n < 1.0
random.randint(a,b)
- 用于生成一个指定范围内的整数。其中参数a是下限,参数b是上限,生成的随机数n: a <= n <= b
random.randrange([start], stop[, step])
- 从指定范围内,按指定基数递增的集合中获取一个随机数;如:random.randrange(10, 100, 2),结果相当于从[10, 12, 14, 16, ... 96, 98]序列中获取一个随机数;
- random.randrange(10, 100, 2)在结果上与 random.choice(range(10, 100, 2) 等效
random.uniform(a,b)
- 用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限;如果a > b,则生成的随机数n: b <= n <= a;如果 a <b, 则 a <= n <= b
random.choice(sequence)
- 从序列中获取一个随机元素;参数sequence表示一个有序类型
random.shuffle(x[, random])
- 用于将一个列表中的元素打乱,shuffle直接改变原有的序列
random.sample(sequence, k)
- 从指定序列中随机获取指定长度的片断。sample函数不会修改原有序列
numpy random模块
numpy.random.rand(d0,d1,…,dn)
- rand函数根据给定维度生成[0,1)之间的数据,包含0,不包含1
- dn表格每个维度
- 返回值为指定维度的array
np.random.rand(4,2)
array([[ 0.02173903, 0.44376568],
[ 0.25309942, 0.85259262],
[ 0.56465709, 0.95135013],
[ 0.14145746, 0.55389458]])
np.random.rand(4,3,2) # shape: 4*3*2
array([[[ 0.08256277, 0.11408276],
[ 0.11182496, 0.51452019],
[ 0.09731856, 0.18279204]],
[[ 0.74637005, 0.76065562],
[ 0.32060311, 0.69410458],
[ 0.28890543, 0.68532579]],
[[ 0.72110169, 0.52517524],
[ 0.32876607, 0.66632414],
[ 0.45762399, 0.49176764]],
[[ 0.73886671, 0.81877121],
[ 0.03984658, 0.99454548],
[ 0.18205926, 0.99637823]]])
除此之外生成[0,1)之间的浮点数的方法还有:
- numpy.random.random_sample(size=None)
- numpy.random.random(size=None)
- numpy.random.ranf(size=None)
- numpy.random.sample(size=None)
numpy.random.randn(d0,d1,…,dn)
- randn函数返回一个或一组样本,具有标准正态分布。
- dn表格每个维度
- 返回值为指定维度的array
np.random.randn() # 当没有参数时,返回单个数据
-1.1241580894939212
np.random.randn(2,4)
array([[ 0.27795239, -2.57882503, 0.3817649 , 1.42367345],
[-1.16724625, -0.22408299, 0.63006614, -0.41714538]])
np.random.randn(4,3,2)
array([[[ 1.27820764, 0.92479163],
[-0.15151257, 1.3428253 ],
[-1.30948998, 0.15493686]],
[[-1.49645411, -0.27724089],
[ 0.71590275, 0.81377671],
[-0.71833341, 1.61637676]],
[[ 0.52486563, -1.7345101 ],
[ 1.24456943, -0.10902915],
[ 1.27292735, -0.00926068]],
[[ 0.88303 , 0.46116413],
[ 0.13305507, 2.44968809],
[-0.73132153, -0.88586716]]])
标准正态分布介绍
- 标准正态分布—-standard normal distribution
- 标准正态分布又称为u分布,是以0为均值、以1为标准差的正态分布,记为N(0,1)。
numpy.random.randint(low, high=None, size=None, dtype=’l’)
- 返回随机整数,范围区间为[low,high),包含low,不包含high
- 参数:low为最小值,high为最大值,size为数组维度大小,dtype为数据类型,默认的数据类型是np.int
- high没有填写时,默认生成随机数的范围是[0,low)
- numpy.random.random_integers(low, high=None, size=None)
- 返回随机整数,范围区间为[low,high],包含low和high
- 参数:low为最小值,high为最大值,size为数组维度大小
- high没有填写时,默认生成随机数的范围是[1,low]
numpy.random.choice(a, size=None, replace=True, p=None)
- 从给定的一维数组中生成随机数;
- 参数: a为一维数组类似数据或整数;size为数组维度(一维数组的长度);p为数组中的数据出现的概率,参数p的长度与参数a的长度需要一致;参数p为概率,p里的数据之和应为1;
- a为整数时,对应的一维数组为np.arange(a);
np.random.choice(5,3)
[0 3 1]
np.random.choice(5, 3, replace=False) # 当replace为False时,生成的随机数不能有重复的数值
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3))
array([['moto', 'iphone', 'xiaomi'],
['lenovo', 'xiaomi', 'xiaomi'],
['xiaomi', 'lenovo', 'iphone']],
dtype='<U7')
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
array([['sansumg', 'sansumg', 'sansumg'],
['sansumg', 'sansumg', 'sansumg'],
['sansumg', 'xiaomi', 'iphone']],
dtype='<U7')
numpy.random.seed()
- np.random.seed()的作用:使得随机数据可预测。
- 当我们设置相同的seed,每次生成的随机数相同。如果不设置seed,则每次会生成不同的随机数
np.random.seed(0)
np.random.rand(5)
array([ 0.5488135 , 0.71518937, 0.60276338, 0.54488318, 0.4236548 ])
np.random.seed(1676)
np.random.rand(5)
array([ 0.39983389, 0.29426895, 0.89541728, 0.71807369, 0.3531823 ])
np.random.seed(1676)
np.random.rand(5)
array([ 0.39983389, 0.29426895, 0.89541728, 0.71807369, 0.3531823 ])