本次数据分析选用的来自kaggle上公开的Video Game Sales With Rating数据,数据集链接Video Game Sales With Ratings。这份数据集记录的是1980年-2016年间发行的视频电子游戏的销量及评分数据。
使用SQL分析数据
本次分析采用的系统为Mac OS 10.15.6,数据库为MySQL 8.0.21,数据库图形化管理工具为mysql-workbench 8.0.21。获得的数据集为csv格式文件,通过mysql-workbench将其导入到MySQL中。
下面是对数据集中各字段的解析:
1.1提出问题
1.总销量排名前10的游戏
2.游戏总体销量排名前10的发行商
3.每个地区中,销量最高的游戏是哪一款
1.2数据分析
* 问题一:
> SQL代码:
SELECT name,global_sales
FROM xfy.video_games_sales
order by global_sales desc
limit 10
> 运行结果:
结论:销量前10的游戏和销售数量分别如上图所示,其中销量最好的是Will Sports游戏。
* 问题2:
> SQL代码:
SELECT publisher,sum(global_sales) as sales
FROM xfy.video_games_sales
group by publisher
order by sales desc
limit 10
> 运行结果
结论:游戏销量前10的发行商和游戏销售数据分别如上图所示。其中销量最好的是任天堂游戏。根据游戏发展状况,在上世纪70~90年代,由于当时游戏产品刚刚起步,各厂商涉水游戏产业,任天堂凭借红白机在当时领先的性能和优秀的游戏产品内容,引领了游戏的潮流,也因此其游戏销量也在各大游戏厂商中独占鳌头。
* 问题3:
> SQL代码:
SELECT t2.name as na_max_game,t1.na_sales,t3.name as eu_max_game,t1.eu_sales,
t4.name as jp_max_game,t1.jp_sales,t5.name as other_max_game,t1.other_sales
from
(SELECT max(na_sales) as na_sales,max(eu_sales) as eu_sales,max(jp_sales) as jp_sales,max(other_sales) as other_sales
FROM xfy.video_games_sales ) as t1
inner join xfy.video_games_sales as t2
on t1.na_sales=t2.na_sales
inner join xfy.video_games_sales as t3
on t1.eu_sales=t3.eu_sales
inner join xfy.video_games_sales as t4
on t1.jp_sales=t4.jp_sales
inner join xfy.video_games_sales as t5
on t1.other_sales=t5.other_sales
> 运行结果
结论:各地地区销售量最好的游戏不一样。北美地区和欧美地区销量最好的是“Will Sports”,日本地区销量最好的是“Pokemon”,而其他地区是“Grand Theft Auto”。结合各地的文化和生活习惯可以看出,欧美玩家偏爱运动类的游戏,而由于文化差异,日本地区对于本土的“Pokman”游戏情有独钟。