pandas-dataframe使用技巧

1.选择DataFrame里面某一列等于某个值的所有行,用一条命令即可解决即:

df.loc[df['columnName']=='the value']

2.对某一列的字段值进行去重

task_id_sets = df['taskid'].drop_duplicates()

3.Pandas把dataframe转成array

df=df.values

4.对某一列的值出现的次数进行统计【默认情况第一列为索引列】

task_id_all_data['tac_photo'].value_counts()

5..对某一列的值出现的次数进行统计【对第一列和计数列进行列名的重命名】

tac_photo_times=task_id_all_data['tac_photo'].value_counts().rename_axis('tac_photo').reset_index(name='counts')
屏幕快照 2020-03-23 下午1.19.58.png

6.将指定列的数据信息挑选出来

df_selected = df[['doh_dt','taskcode','tachograph_single_info','taskid','tac_photo']]

7.创建一个空的dataframe

df = pd.DataFrame(columns = ["ebayno", "p_sku", "sale", "sku"]) #创建一个空的dataframe

8.指定列名

    tac_photo_split.columns=['http','pic','date','ID','num','random_value','jpg']

9.索引——>列

df['index'] = df.index

10.指定行的值

task_id_all_data.loc[[0]]

11.指定行列的值

task_id_all_data.iloc[0,5]

12.排序
task_uuid_all_data.sort_values(by=["tac_time1"],inplace=True,ascending=[True])

13.两列文本合并成一列
merge_df['type_action'] = merge_df['type'] +"(" + merge_df['action']+")"

14.group-by
a=merge_df.groupby(["index", "type"], as_index=False)['task_uuid'].count()

15.整数列转换为字符串
merge_df['index'].apply(str)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容