完成时间:2018年5月14日
纲要
通过使用SQL查询数据和排除空值,导出.csv文件,通过excel打开查看,利用excel的averge函数计算移动平均值并制作折线图,或者通过tableau的WINDOW_AVG函数计算移动平均值,并制作可视化图。本文使用了tableau工具实现数据可视化分析。
可视化时,我的关键和难点在于如何思考和提出问题,因此才可以分析问题,得出结论。
步骤
为获取:世界的温度数据和大连市的温度数据
提取数据的SQL:
SELECT t.year,
t.country,
t.city,
t.avg_temp AS avg_city,
a.avg_temp AS avg_global
FROM city_data t
INNER JOIN global_data a ON a.year = t.year
WHERE t.country='China'
AND t.city = 'Dalian'
AND t.avg_temp IS NOT NULL
导出为csv文件,命名:探索未来气候发展趋势.csv,通过excel打开查看数据:
可视化
工具:tableau
移动平均值,与前7年的移动均值线图:
观察与结论:
1、对于移动平均值,全球比大连市的温度更高还是更低?
相比大连市,全球的移动均值温度更低,而且这种差异基本保持一致。
2、对于移动平均值,大连市和全球的温度趋势走向是怎样的?
大连市和全球都有上升的趋势,而且全球温度移动平均值升高的趋势比大连市要高,说明温度全暖问题值得关注
3、对于二者的移动平均值差异,有没有波动较大的年份?
在1829年、1932年和1837年是温差波动较大,移动均值差异上,大连市比全球分别高6.39、2.58和4.52,而波动的整体均值为大连市比全球高1.82。
4、对于二者的移动平均值差值,随着时间的推移,整体趋势升高还是降低?
整体趋势是降低的,大连市和全球温度的移动平均值的差异在缩小