IQ数据分析
自己之前做第一次作业,拿别人的作业来研究了一番,算不上独立完成。这次,我还是自己一步步研究吧
# 导入数据包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
%config InlineBackend.figure_format = 'retina'
# ??以上两段代码,什么意思,需要研究。
#导入Iq数据
iq_data = pd.read_csv('IQscore.csv')
# 查看前五行
iq_data.head(5)
len(iq_data)
70
# 将iq_data 中’IQ‘这一列数据存入变量iq中
iq = iq_data['IQ']
#计算平均值和标准差
iq_mean=iq.mean()
iq_std = iq.std()
#输出均值和方差
print("均值:"+str(iq_mean))
print('标准差:'+str(iq_std))
均值:100.82857142857142
标准差:15.015905990389498
数据可视化
x = np.arange(60,150,1)
#??这个60和150代表的是x轴的最大和最小值吗? 那1代表什么意思呢?
def normfun(x,iq_mean,iq_std):
pdf = np.exp(-((x-iq_mean)**2)/(2*iq_std**2))/(iq_std*np.sqrt(2*np.pi))
return pdf
y = normfun(x,iq_mean,iq_std)
plt.plot(x,y)
plt.hist(iq,bins=7,rwidth=0.9,normed=True)
#?? bins=7意思是每个直方图占7个数字那么宽吗?,rwidth=0.9 是指,每两个直方图之间的间距为0.9吗? normed=true是什么意思?
plt.title('IQ distribution')
plt.xlabel('IQ score')
plt.ylabel('Probability')
plt.show
<function matplotlib.pyplot.show>
ps:最开心的是,捣鼓出了,如何把notebook中的内容,转到简书中。