Pandas库介绍--统计相关

数据应用上节读取的CSV;
1.值分类汇总

counts = df['hGrade'].value_counts()
print counts

2.绘制柱形图,并保存

plt = counts.plot(kind='bar').get_figure()
plt
plt.savefig('/Users/baidu/Downloads/plot.png')

3.数据分组

#数据准备
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['foo', 'bar','foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                  'B':['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                  'C':np.random.randn(8),
                  'D':np.random.randn(8)})
print df
#根据列A进行分组,取每组第一行数据
grouped = df.groupby('A')
print grouped.first()
#根据多列进行分组A,B列
grouped = df.groupby(['A', 'B'])
print grouped.last()

根据列进行分组

def get_type(letter):
    if letter.lower() in 'abem':
        return 'vowel'
    else:
        return 'consonant'
    
grouped = df.groupby(get_type, axis=1)
print grouped.first()
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容