numpy and pandas分别用来传数据和分析数据
线性代数:特征值和特征向量
特征值,即
一个常数*某特征向量的基础解系为特征向量
数组的零表是广播操作
不相关数组的copy使用copy()函数
改变维度,将每一维行列信息传给reshape(hang,lie,...)
矩阵维度一般提列
列不变
行一直会变
python numpy数组的选择使用在数组的中括号里面
mumpy数组里参数为负数,代表倒数第几行
切片按“:”切分,“,”是选择点
列合并,行合并
np.vstack:垂直连接
np.hstack:水平连接
转置.T
axis=1为水平变化,axis=0为垂直变化
1表示横轴,方向从左到右;0表示纵轴,方向从上到下。当axis=1时,数组的变化是横向的,体现出列的增加或者减少。反之,当axis=0时,数组的变化是纵向的,体现出行的增加或减少。
sort(1)按行排序
sort(0)按列排序
numpy里1为行,0为列
numpy用的都是数字,先把数据中某一列数字提取出来,再返回给pandas数据处理
series类似于一维数组
max()和min()都是numpy的函数
pandas应该使用.value()或者.index()
花式索引不要忘记内部的中括号
numpy赋值not a number,赋值的时候要用
series[index]=np.NaN
pandas中NaN与None等价
dataframe就像是一个二维表
行号(索引)自动生成,列名为字典里提供的index(不提供默认索引为数字)
保持镇定,什么时候该思考什么,就不要去想,沉浸在现在的思考中
如何在series中获得某行(不适用切片) 列只能靠列属性值取,不能根据标号取,如何解决?
doc()行优先
loc()行标签
iloc()行号
pop()方法可以将所选列从原数据块中弹出,原数据块不再保留该列。
删行·列用drop(),根据axis不同选择闪出某一行或者列
np.array()强制转换为数组模式
pandas单纯加会产生NaN,如果使用add函数就可以定义参数
数据筛选(重要)
contains()是否包含
agmin()返回最小值的索引位置
彭德怀是指挥百团大战的人
map跟着字典,字典的key最好使用字符串
你可得智障了
apply可以根据参数里的行数加一行