python 分布分析

import numpy

import pandas

data = pandas.read_csv(

'D:\\PDA\\5.3\\data.csv'

)

aggResult = data.groupby(

by=['年龄']

)['年龄'].agg({

'人数': numpy.size

})

data.年龄.hist()

bins = [

min(data.年龄)-1, 20, 30, 40, max(data.年龄)+1

]

labels = [

'20岁以及以下', '21岁到30岁', '31岁到40岁', '41岁以上'

]

data['年龄分层'] = pandas.cut(

data.年龄,

bins,

labels=labels

)

pAggResult = round(

aggResult/aggResult.sum(),

)*100

pAggResult['人数'].map('{:,.2f}%'.format)

最后编辑于：2017.12.10 04:32:29

python | 基础分析
1-数据准备 1.1-函数 1.2-向量化运算 2-数据处理 2-1 导入 2-1-1 CSV eg：from p...
黑喵爱吃棉花糖阅读 4,590评论 0赞 5
python RFM分析
import numpy import pandas data = pandas.read_csv( 'D:\\P...
正在充电Loading阅读 5,745评论 1赞 6

python数据分析（十）
# -*- coding: utf-8 -*- from __future__ import division f...
小豆角lch阅读 5,296评论 0赞 1
python | 基础画图
散点图 eg：import matplotlib;from pandas import read_csv;impo...
黑喵爱吃棉花糖阅读 4,766评论 0赞 5
张小龙的产品设计
一、微信的演化 2010年11月19日23时58分，张小龙在腾讯微博上写下了这么一句话：我对iPhone5的唯一...
linlin7阅读 4,268评论 0赞 2

赞1赞

赞赏

手机看全文