1.dataframe对象既有行索引又有列索引,行索引表明不同行,横向索引,index,0轴,axis=0列索引,表名不同列,纵向索引,叫columns,1轴,axis=1
2.pandas常用统计方法
取平均值 df["列名"].mean() 变成列表 df["列名"].unique()
逗号分隔 test = df["列名"].str.split(",").tolist(),在此基础上求长度,用两个循环将其展开到一个列表里
list = [i for j in test for i in j ] 或者Numpy中的flatten方法 np.array(test).flatten(),长度为num = len(set(test))
视频实例
练习代码