1. pd.DataFrame中增加行
#将df添加到pd_login中。ignore_index=True,否则pd_login中df是其原index,导致pd_login的index混乱
df = pd.read_csv(file_path)
df['day'] = day
pd_login = pd_login.append(df,ignore_index=True)
2. pd.DataFrame修改columns名称
#修改pd_in_email中列名称,将email修改成from
pd_in_email = pd_in_email.rename(columns={'email':'from'})
3. pd.DataFrame修改某行某列的数值
#将pd_in_email中属性from为e的行对应的属性label修改成‘人力资源’
pd_in_email.loc[pd_in_email[pd_in_email['from']==e].index,'label'] = '人力资源'
4. pd.DataFrame数据融合
pd.merge详细操作见这里
#将pd_kmeans_label和pd_email数据根据属性‘from’合并,其中left 左边的pd_kmeans_label在合并后的pd.DataFrame的左边
pd_merge = pd.merge(pd_kmeans_label,pd_email,how='left',on='from')