现在有一些这样的时间数据,在excel中是字符形式的
需要把其转换为datetime格式,然后忽略分钟对小时进行概率统计
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
sns.set_style('darkgrid')
works=pd.read_excel('E:\\untitled3\output.xls')
# plt.scatter(works['高峰小时'])
works['高峰小时']=works['高峰小时']
Time=[]
for i in range(0,len(works)):
Time.append(datetime.strptime(works['高峰小时'][i], '%H:%M'))
# sns.distplot(works['高峰小时'], color='#ff8000')
# plt.show()
emmm=[]
for i in range(0,len(Time)):
emmm.append(Time[i].hour)
print(emmm)
sns.distplot(emmm, color='#ff8000')
plt.show()
由图可知,高峰小时发生在早上7、8点。或者晚上3、4点的时候