7.1Numpy基础
介绍了Numpy数组对象特性,array()函数、arrange()函数、linspace()函数、随机函数、ones()、zeros()等函数生成数组的原理以及Numpy的数据类型。
01数组对象特性
·ndarray.ndim:数组的维度
·ndarray.size:数组元素的总数
·ndarray.shape:数组的形状
·ndarray.dtype:数组中元素的数据类型
·ndarray.T:数组转置
02利用各类函数生成数组
·array()函数:
array()函数接收一切序列型的对象(包括其他数组),然后产生一个新的含有传入数据的Numpy数组;在使用array()函数时要注意将数据(元组、列表)放入()、【】,以免报错。
·arange()函数:
arange() 函数同range()类似,但 arange 常常用来生成指定范围内的等差数组,调用格式为arange(start,stop,step);arange(n) 实际上是生成的0 ~(n-1)的序列数。
扩展:numpy数组用扩展函数repeat()和tile(),但是数组不能进行动态扩展,所以在调用上述函数进行扩展的时候,系统会重新分配新的空间进行存储扩展后的数据(repeat()函数不会修改原有的numpy数组)。
repeat()函数
功能:可以对数组中的元素进行连续复制。
用法:numpy.repeat(a. repeats, axis=None)
a.repeat(repeats, axis=None)
tile()函数
功能:对整个数组进行复制拼接
用法:numpy.tile(a, reps)
其中a为numpy数组,reps为数组的重复次数。
·利用ones()、zeros()、ones_like()、zeros_like()等函数可以生成全0或全1的数组。
·linspace()函数:
linspace(start,stop,num)可以创建一个等差数组,单不需要指定差值;该函数生成数组时默认包含终值,若设置为endpoint=False,则不包含终值。
·使用随机函数生成数组:
03数据类型
需要注意的时,ndarray要求每个数组元素的数据类型是一样的,而python列表允许包含不同数据类型的元素。数据类型之间可用astype()函数转换,转换时原数组不变,生成一个新数组。
7.2存取数组元素
介绍了python和numpy基本索引和切片操作的异同,并在一维数组的基础上扩展了二维数组的索引操作,最后重点介绍了布尔索引的相关内容。
01基本索引和切片操作
·基本索引:
不难看出,基本索引可以是单个索引下标访问元素,也可以直接访问第x,y位元素(但是多个下标要放入【】中),也能以切片的形式访问(切片访问不含最后一个元素)。
·切片操作:
从上面的例子可以看出,数组c时数组b的切片,且二者共享内存,将c的元素改变时原数组b的对应元素也随之改变——因为Numpy的数组切片产生的是一个视图,视图和原数组指向同一个内存两者相互影响,但这样一来却提升了数组的操作性能。
若想避免原数组元素被修改,可用c=b[].copy()来实现。
小结:Numpy的很多操作要区分是视图还是复制。
02二维数组的索引操作
花式索引:
要选取数组b中的3,6,9数据项,这三个数据的索引坐标为【0,3】、【1,2】、【2,1】,那么访问这三个数的语句可以写成上图样式。(花式索引得到的是复制数组,而不是数组视图)
其它:
03布尔索引:
1、布尔索引用一个布尔数组来索引数组元素,选取Ture值对应位置的数据:
2、利用布尔索引选取数据时,还可以结合&(与)、|(或)、~(非)等逻辑运算进行更复杂的数据选取:
3、Numpy还提供一个按条件选取数据的where(condition,x,y)函数,其中的condition就是一个布尔数组,函数将按其逻辑值分别选择数组x,y中的值:
小结:布尔索引实现的是通过列向量中的每个元素的布尔量数值对一个与列向量有着同样行数的矩阵进行符合匹配。而这样的作用,其实是把列向量中布尔量为True的相应行向量给抽取了出来。如果进行变量或者标定量的大数据处理,这种筛选功能的使用肯定会给程序的设计带来极大的便捷。
参考网站:
https://blog.csdn.net/TwT520Ly/article/details/79428360?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param;
https://numpy.org/learn/
补充知识:
列表是什么?
列表是由一系列按特定顺序排列的元素组成,可以将任何东西加入列表中,其中的元素之间没有任何关系;Python中的列表(list)用于顺序存储结构。它可以方便、高效的的添加删除元素,并且列表中的元素可以是多种类型。
数组是什么?
数组是一个同一类型的数据的有限集合,另外数组有列表不具有的性质,如维度和转置。
列表和数组区别:
1列表list中的元素的数据类型可以不一样,而数组array里的元素的数据类型必须一样;
2列表list不可以进行数学四则运算,数组array可以进行数学四则运算;
3相对于array,列表会使用更多的存储空间。
4在使用上:如果我们需要一个只包含数字的列表,那么array.array比list更高效。数组支持所有跟可变序列有关的操作,包括.pop,.insert和.extend。另外,数组还提供从文件读取和存入文件的更快的方法,如.frombytes和.tofile。创建数组需要一个类型码,这个类型码用来表示在底层的C语言应该存放怎样的数据类型。比如b类型码代表的是有符号的字符(signedchar),array(‘b’)创建出的数组就只能存放一个字节大小的整数,范围从-128到127,这样在序列很大的时候,我们能节省很多空间。
视图与复制:
1、区别:复制(副本)即原有数据的一份拷贝,因此对副本的任何修改不会影响原有数据,同理,对原有数据的任何修改亦不影响副本数据列表切片(复制出现的情况:调用deepCopy()函数;调用Numpy中的copy()函数等等); 视图仅是原有数据的一个引用或别称,通过视图修改数据可反映到对原有数据的修改,因此,在意图不明确的情况下需慎重操作(视图出现的情况:Numpy中的赋值操作和切片操作等)。