前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
本文概述
Pandas 是数据科学家做数据处理时,使用最多的工具。
对比Excel,我们可以发现:Pandas基本可以实现所有的Excel的功能,并且比Excel更方便、简洁,其实很多操作我们在过去的文章中,或多或少都讲述过。
但是在数据框上,完成各种 “条件格式” 的设置,帮助我们更加凸显数据,使得数据的展示更加美观,今天还是头一次讲述。
上图左表展示的是某班级期末考试的成绩数据,我们要利用左表完成如右表的效果展示,需要完成的目标如下:
- (1)将“均值”这一列的数值,保留1位小数;
- (2)给这份数据,添加一个标题辅助说明“高三(5)班期末考试成绩”,方便我们区分数据;
- (3)隐藏索引列(注意最左边!);
- (4)隐藏指定列,有些列我们不作处理,可以不做展示;
- (5)将“语文”这一列的数值,依数值大小画条状图;
- (6)将“均值”这一列数据最大的值,高亮(highlight)展示;
- (7)将“数学”这一列的数值,依数值画一个绿色的colormap;
- (8)将整个DataFrame 的空值显示为红色,着重突出;
一行代码即可上述所有操作。
用过Pyecharts的朋友可能都知道“链式规则”,在这里我们同样可以采用这种方法,用一行代码就可以实现上述所有的功能。
1. 读取数据
import pandas as pd
df = pd.read_excel("特殊.xlsx")
df.index = list(range(df.shape[0]))
df
结果如下:
2. 一行代码
df.style.format('{:.1f}',subset='均值').set_caption('高三(5)班期末考试成绩').\
hide_index().hide_columns(['索引']).bar('语文',vmin=0).highlight_max('均值').\
background_gradient('Greens',subset='数学').highlight_null()
结果如下:
使用说明
这个是Pandas0.17.1中的新功能。官方文档中说到:这是一项新功能,正在积极开发中。我们将添加功能,并可能在将来的版本中进行重大更改。
这个方法出现在pandas.formats.style.Styler类中,今天在这里就不详细介绍该方法的原理,大家知道怎么使用就行,后将在后面的文章中为大家慢慢介绍。
上面我们直接一行代码实现所有的功能,如果我们只想实现某一个功能怎么办呢?
- df.style.format( )
- df.style.set_caption( )
- df.style.hide_index( )
- df.style.hide_columns( )
- df.style.bar( )
- df.style.highlight_max( )
- df.style.background_gradient( )
- df.style.highlight_null( )
好了,今天就为大家介绍到这里,赶紧下去尝试吧!