如何使用Power BI对2019互联网趋势报告进行进一步的分析?——人口现状篇

一、 全球互联网用户分析

报告页_008
报告页_008

我们从图表中看到,增长率从2010年开始整体还在增长,但是增速还是下降为主,在2018年的时候出现了个反弹。也就是说增速是一直在降低,这个是什么原因导致的呢?互联网用户还能增长多少呢?我们通过全球人口数据分析得到如下展示。

2019人口Top20
2019人口Top20

我们要先了解目前全球总人口数,我们通过互联网搜索下全球人口,找到一个2019年世界人口排名的网页,我们可以通过Power Query来获取其数据来进行下一步的分析。https://www.phb123.com/city/renkou/rk.html

2019世界人口排名
2019世界人口排名

1. 数据抓取

我们打开网页可以看到这个是有多个页面组成的一个数据表,我们点击末页可以看下一共有多少页(这个是为了方便我们循环抓取使用)。点击后发现一共12页,同时网页地址是这样的。https://www.phb123.com/city/renkou/rk_12.html

数据页面数量
数据页面数量

也就是说,最终网页变化的就是rk_之后的这个数字。那我们进入Power Query里面,看下如何进行抓取。
使用从web导入的方式随便导入其一页的地址,可以发现数据是存在在Table 0标签里的。

2019人口数据源
2019人口数据源

我们勾选Table 0后可以进入到编辑页面,并打开高级编辑器,可以看到里面主要是有3行代码。源,Data0也就是导航以及更改类型3个步骤。我们可以把源和Data0组合下。

单网页数据抓取
单网页数据抓取

我们主要是针对第一条代码进行循环抓取。

List.Transform({1..12}, each 
              Web.Page(Web.Contents("https://www.phb123.com/city/renkou/rk_"
                                    & Text.From(_) &
                                    ".html"
                                    )
                       ){0}[Data]
              )

得到一个包含表格的列表格式。

循环抓取结果
循环抓取结果

我们再次转换成表格并展开即可得到我们所需要的数据。并在最后一步把数据格式都调整下并加载到Power BI的表里。

2. 在Power Pivot里面进行格式调整。

对国家这里把数据分类选择为国家/地区;增长率格式为百分比,并保留3位小数;人口数量这里也可以改成千分位。

人口数量格式调整
人口数量格式调整
增长率数据格式调整
增长率数据格式调整
国家数据格式调整
国家数据格式调整

3. 编写度量值

A. 世界总人口数

世界总人口 = Round(Sum([人口数量])/100000000,3)

解释:
因为我们不需要很精确,一般表示世界人口可以用亿为单位,所以这里就直接求和后除以亿并保留3位小数。

B. 数量最多的前20位国家人口数量

人口top20 = 
var top20_rk=Topn(20,All('世界人口'[国家]),[世界总人口])
return Calculate([世界总人口],top20_rk,Values('世界人口'[国家]))

解释:
因为我们查看数据都是以国家为维度,所以在求Top20的时候需要添加All来忽略国家的维度。但是最后要仅显示前20位的时候,则还需要把维度还原,所以用了Values。

C. 数量最多的前20位国家的人口增长率

Top20_增长率 = Calculate(Average('世界人口'[增长率]),
                        TopN(20,
                             All('世界人口'[国家]),
                             '世界人口'[世界总人口],
                             DesC),
                        Values('世界人口'[国家])
                         ) 

解释:
写法差不多,只不过这里省略了变量,同时求和改成了平均值(这里无所谓是用哪个,因为最终会被筛选成为唯一值,只不过增长率一般来说不大会用累计求和)。

4. 可视化展示

这里我们一共用了2个图形,一个是地图,一个是折线和簇状柱形图。

A. 地图

可视化选项里面选择地图。

可视化_地图
可视化_地图

把对应的维度及数据拖入进对应的地方即可。

可视化_地图_数据
可视化_地图_数据

在属性里面,可以把标签类别的字体大小,气泡的大小相应改动即能得到如上效果。

可视化_地图_属性
可视化_地图_属性
B. 折线和簇状柱形图

可视化里新建一个折线和簇状柱形图

可视化_折线和簇状图
可视化_折线和簇状图

把共享轴,列值,行值分别填入相对应的数据。

可视化_折线和簇状图_数据
可视化_折线和簇状图_数据

更改X轴国家字段以及标签的文字大小,调整到合适位置。

可视化_折线和簇状图_属性_X轴
可视化_折线和簇状图_属性_X轴

因为我们把柱形图和折线图相对分隔开,所以就需要调整Y轴的最大值和最小值以便能够让图形看起来更容易。

可视化_折线和簇状图_属性_Y轴
可视化_折线和簇状图_属性_Y轴

这里我们把人口的最大值改为20,增长率的最小值改为-0.15,这样就能把柱形图和折线图相对的隔开。

可视化_折线和簇状图_属性_Y轴数值
可视化_折线和簇状图_属性_Y轴数值

这样我们就把这张世界人口图给做好了。
那我们做国际贸易,使用这张图能知道些什么呢?

5. 分析结果

目前全世界总人口约为75.8亿人,互联网用户目前为不到40亿,正好和后面一张分析图形成51%的互联网渗透率的对应关系,数据能够得到相互印证。

报告页_010
报告页_010
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容