九、
八、统计某一属性相同值出现次数
比如要统计’label’这一列各个值出现的次数, 使用df_train.loc[:,'label'].value_counts()即可
df["author"].value_counts()
七、遍历
1.value_count
for i,v in voiceUuid_value_count.items():
2.
六、筛选、删除特定行、列
https://www.cnblogs.com/cocowool/p/8421997.html
删除具体列 df.drop('成交数量',axis=1)
删除具体行 df.drop('2018-2-3')
删除特定数值的行(删除成交金额小于10000) df[ df['成交金额'] > 10000]
删除某列包含特殊字符的行 df[ ~ df['证券名称'].str.contains('联通') ]
如果想取包含某些字符的记录,可以去掉~ df[ df['证券名称'].str.contains('联通') ]
https://blog.csdn.net/songyunli1111/article/details/79306639
按标签来删除列 df.drop(['B','C'],axis=1,inplace=True)
按序号来删除列 x = [1,2] df.drop(df.columns[x],axis=1,inplace=True)
按序号来删除行 df.drop([0,1],inplace=True) #默认axis=0
五、Pandas合并 去重
hotelDataDf = pandas.concat([hotelDataDf08,hotelDataDf09,hotelDataDf10])
cHotelDataDf = hotelDataDf.drop_duplicates()
四、Pandas查询最大值
行最大值
https://codeday.me/bug/20171209/105857.html
列最大值
https://blog.csdn.net/ssswill/article/details/85260320
三、DataFrame 保存为文件
https://blog.csdn.net/tz_zs/article/details/81137998
read_csv = pd.read_csv("read_data.csv")
二、创建Pandas
二、行数
获得Pandas数据的行数
dataFrame -> len(data.index)
series_movie_akDf = cMovieDataDf['ak'].value_counts()
一、行、列
https://www.cnblogs.com/nxf-rabbit75/p/10105271.html
按条件取行
选取等于某些值的行记录 用 ==
df.loc[df[‘column_name’] == some_value]
条件选取1
fData31700056 = cMapDataDf[cMapDataDf.event_id.str.contains('31700056',na=False)]
条件选取2
time_df_100 = time_df[time_df.minute<100]
2.行、列互换