序言:
Python的可视化工具,以下截图,均以展示图表实例,如需了解部分对象的输出结果,可参照我Github上的代码,3Q🌹
【课程3.13】 表格样式创建
表格视觉样式:Dataframe.style → 返回pandas.Styler对象的属性,具有格式化和显示Dataframe的有用方法
样式创建:
① Styler.applymap:elementwise → 按元素方式处理Dataframe
② Styler.apply:column- / row- / table-wise → 按行/列处理Dataframe
样式
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline
# 样式
df = pd.DataFrame(np.random.randn(10, 4), columns = ["a", "b", "c", "d"])
sty = df.style
print(sty, type(sty))
sty
按元素处理样式:style.applymap()
# 按元素处理样式:style.applymap()
def color_neg_red(var):
if var < 0:
color = "red"
else:
color = "black"
return("color:%s" %color)
df.style.applymap(color_neg_red)
# 创建样式方法,使得小于0的数变成红色
# style.applymap() → 自动调用其中的函数
按行/列处理样式:style.apply()
# 按行/列处理样式:style.apply()
def hightlight_max(s):
is_max = s == s.max()
# print("##",is_max)
lst = []
for v in is_max:
if v:
lst.append("background-color: yellow")
else:
lst.append("")
return(lst)
df.style.apply(hightlight_max, axis = 0, subset = ["b", "c"])
# 创建样式方法,每列最大值填充黄色
# axis:0为列,1为行,默认为0
# subset:索引
样式索引、切片
# 样式索引、切片
df.style.apply(hightlight_max, axis = 1, subset = pd.IndexSlice[2:5, ["b", "d"]])
# 通过pd.IndexSlice[]调用切片
# 也可:df[2:5].style.apply(hightlight_max, subset = ["b", "d"]) -> 先索引行再做样式
【课程3.14】 表格显示控制
df.style.format()
按照百分数显示
# 按照百分数显示
df = pd.DataFrame(np.random.randn(10, 4), columns = ["a", "b", "c", "d"])
print(df.head())
df.head().style.format("{:.2%}")
显示小数点数
# 显示小数点数
df.head().style.format("{:.4f}")
显示正负数
# 显示正负数
df.head().style.format("{:+.2f}")
分列显示
# 分列显示
df.head().style.format({"b": "{:.2%}", "c": "{:+.3f}", "d": "{:.3f}"})
【课程3.15】 表格样式调用
Styler内置样式调用
定位空值
# 定位空值
df = pd.DataFrame(np.random.rand(5,4), columns = list("ABCD"))
df["A"][2] = np.nan
df.style.highlight_null(null_color = "red")
色彩映射
# 色彩映射
df = pd.DataFrame(np.random.rand(10, 4), columns = list("ABCD"))
df.style.background_gradient(cmap = "Greens", axis = 1, low = 0, high = 1)
# cmap:颜色
# axis:映射参考,0为行,1以列
条形图
# 条形图
df = pd.DataFrame(np.random.rand(10, 4), columns = list("ABCD"))
df.style.bar(subset = ["A", "B", "C"], color = "#d65f5f", width = 100)
# width:最长长度在格子的占比
分段式构建样式
# 分段式构建样式
df = pd.DataFrame(np.random.rand(10, 4), columns = list("ABCD"))
df["A"][[3,2,1]] = np.nan
df.style.bar(subset = ["A", "B"], color = "#d65f5f", width = 100).highlight_null(null_color = "yellow")