迟来的第一讲作业

1.导入文件

打开Jupyter Notebook,讲文件路径定位到数据存储文件夹,然后点击New,创建Python3。看之前学员的作业,说是创建notebok,但是我的是灰色的,无法创建。

#导入数据
#导入模块,并起别名
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats #从stats模块中导入scipy
weight_data = pd.read_table("weight.txt") #将数据读入
weight_data.shape
(80, 1)

2.计算均值和方差

weight_data['weight'].mean()
50.7
weight_data['weight'].var()
39.27594936708859

3.画直方图

fig = plt.figure()
x = weight_data['weight']
ax = fig.add_subplot(111)
numBins = 20
ax.hist(x,numBins,color='blue',alpha=0.6,rwidth = 0.8)
plt.title(u'weight')
plt.show()
output_7_0.png

4.数据分析

数据分析
1、均值为50.7,方差为39.27,离散度不高,体重均值偏轻,怀疑是女性或者未成年群体居多。
2、数据整体呈正态分布。
3、体重在45——50岁之间人数最多,最高不超过70,最低不超过35。

第二个文件

1.导入文件

AirPassengers_data = pd.read_csv("AirPassengers.csv")
AirPassengers_data.shape
(144, 2)
passengers = AirPassengers_data['NumPassengers']
mouth = AirPassengers_data['Month']

2.计算均值和方差

passengers.mean()
280.2986111111111
passengers.var()
14391.917200854701

3.画直方图

fig = plt.figure()
x = passengers
ax = fig.add_subplot(111)
numBins = 50
ax.hist(x,numBins,color='blue',alpha=0.6,rwidth = 0.8)
plt.title(u'passengers')
plt.show()
output_18_0.png

4.数据分析

数据分析
1、均值为280.2,方差为14391.9,离散度很高,说明乘客数量波动较大。
2、直方图有递减趋势,随着人数的增多,次数也有一定的下降。
3、乘客在100到200之间人数最多,而且分布比较平均。
4、人数在230次数最多,而且高出其他数据很多,怀疑是异常值,需要重新检查数据。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 《数据分析的统计基础》的读书笔记 作 者:经管之家、曹正凤 出版社:电子工业出版社 版 次:2015年2月第1...
    格式化_001阅读 13,568评论 1 58
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 12,934评论 0 3
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 177,181评论 25 709
  • 这件事还是要从下午的听写生字说起。学校组织听写生字的比赛,班级之间交叉听写,听写完了以后,发现事情不是那么回事。
    娇鹏阅读 1,112评论 1 0
  • 心灵对话.写作小组16篇 大年初二去了趟南京,喜爱南京街道冬天里青葱的树,温和的雨,柔软的风,也许因为冬天里那抹绿...
    美丽的小鱼阅读 1,049评论 0 0

友情链接更多精彩内容