作业内容
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
weight_data = pd.read_table('weight.txt')
weight_data.shape
(80, 1)
weight_data ['weight'].mean()
50.7
weight_data['weight'].var()
39.27594936708859
fig = plt.figure()
x = weight_data['weight']
numBins = 18
ax = fig.add_subplot(111)
ax.hist(x,numBins,color='green',rwidth=0.6)
plt.title('Weight')
plt.show()
Passengers_data = pd.read_csv('AirPassengers.csv')
Passengers_data.shape
(144, 2)
Passengers_data['NumPassengers'].mean()
280.2986111111111
Passengers_data['NumPassengers'].var()
14391.917200854701
fig = plt.figure()
x = Passengers_data['NumPassengers']
ax = fig.add_subplot(111)
numBins = 15
ax.hist(x,numBins,color='green',rwidth=0.6)
plt.title('Passengers')
plt.show()
总结
- 本次作业用了Jupyter,可以导出为Markdown,所以把简书的默认编辑模式改成了Md,不准备改回去了,强制性用Md,跳出舒适圈。
- 本次作业对没有Python基础的人(比如我)来说有一定难度,非常幸运的是有一群人在一起战斗,感谢泰阁志大数据社群的各位小伙伴,尤其是余欣博士的科普文章以及元元同学细致的作业及分析
- 期待自己不断进步。
本文为 泰阁志-解密大数据第三次作业,了解更多请关注微信“泰阁志”。