2020-04-16

                       numpy,pandas常用函数

numpy 和 pandas  是 python 中俩个常用于科学计算以及数据清洗的强力模块。numpy 的 ndarray 在处理(矩阵)计算,尤其是在神经网络处理输入的图片时,特别有效;pandas 则在数据清洗时特别好用。

一.numpy常见函数

首先要说的是,numpy不同于pandas,若是想要查看numpy数组的内容,只能用print!!!pandas 可以用 head() 函数查看前5行,而且格式还比较工整)若是该 numpy 数组特别大,看起来就比较难受🙃,只能用 shape() 函数查看一下数组形状(m行n列)。

然而 numpy 数组很方便,它的 zero( ‘shape’ ) ,ones( ‘shape’ ) 函数,可以创建全 0 和 全 1 的,指定维度的数组。目测应该是内存连片附值。

dtype 函数 既可以查看数组的类型(np.dtype),又可以用来类型转换。size函数可以查看数组大小。

二.pandas常见函数

pandas 常见函数有 read_csv()用来读取文件.

 pandas 有俩类数据结构:DataFrame 和 Series 。

DataFrame 类似于数据库表 ,行索引与列索引相同;

Series类似于字典,有index 和 values俩个属性。

上文提到 DataFrame 类似于数据库表,所以他的常用函数也和数据库表类似,比如说:rename() 函数用来重命名列,

drop 函数用来删除不必要的行和列 drop ( columns = [] ),

                                                         drop( index = [] )

apply() 函数自由度高,常用来对整列的数据进行操作,df['name'].apply(str.upper),将整个 ‘name’ 列转换成大写。

describe()函数对数据进行统计并输出。

merge() 和 concat() 用于数据合并。

merge 可以通过设置参数 ‘on == ’ 指定合并对象。

astype() 函数进行数据类型转换

hist() 函数可以绘图


groupby

log1p

exp1m

pandas 的 loc(columns),iloc(index) 函数

df.iloc[1:3,2:4] (df.iloc[index,columns])

df.loc[1:2,'A':'B]    (df.loc[行索引,列索引])

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容