pandas将dataframe中某列按照条件赋值方法,求每行最大值、均值、方法
-
批量修改dataframe中某一列
在数据处理过程中,经常会出现对某列批量做某些操作,比如dataframe df要对列名dataframe的apply函数来实现,具体实现代码如下:def fun(x): if x>=30: return 1 else: return 0 values = feature['values'].apply(lambda x:fun(x)) # 若需要将改动赋值给原始的feature的列的话,可以进行一次赋值 feature['values']= values # 或者直接一次修改后赋值 feature['values']=feature['values'].apply(lambda x:fun(x))
-
求dataframe一行中的最大值、最小值、均值、求和等操作实现:
feature['max']=feature[['math','chinese','pe']].max(axis=1) feature['mean']=feature[['math','chinese','pe']].max(axis=1) feature['sum'] = feature[['math','chinese','pe']].sum(axis=1)
scipy.stats.tri_mean
scipy.stats.trim_mean(arr,proportiontocut,axis=0)
取arr数组上下切割proportiontocut之后的平均值。
[图片上传失败...(image-704c01-1617280148300)]
[图片上传失败...(image-ac91dc-1617280148300)]