摘要
热力图是数据可视化项目中,比较常用的显示方式。通过颜色变化程度,它可以直观反应出热点分布,区域聚集等数据信息。热力图以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。热力图可以显示不可点击区域发生的事情。城市热力图该检测方式只提供参考。Folium 是 Python 中功能强大的数据可视化库,主要用于帮助人们可视化地理空间数据。使用Folium,只要知道其纬度和经度值,就可以创建世界上任何位置的地图。
热力图简介
热力图是数据可视化项目中,比较常用的显示方式。通过颜色变化程度,他可以直观反应出热点分布,区域聚集等数据信息。
热力图以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。热力图可以显示不可点击区域发生的事情。城市热力图该检测方式只提供参考。
图 1:热力图示例
热力图的功能:
① 在热力图的帮助下,优化和调整网页设计也有了科学依据,我们再也不必盲目升级,只需要对症下药即可。另外,还可以通过动态来考量页面调整前后的点击效果。
② 广告的投放应尽可能的选择点击行为集中和访客多的页面,这样效果会更突出,点击率才会更高。
③ 通过链接点击图来了解同一栏目下不同文字链接的被点击次数,判断此链接标题和内容的受欢迎程度,以便优化排版。
④ 利用没有链接地方的点击,将页面的流量价值实现最大化。例如:点击多的文字却没有链接, 说明访客对这方面的内容非常感兴趣,可以加上链接方便于访客了解更多。
热力图的 3 种类型及原理:
比较常见的热力图主要有 3 种:基于鼠标点击位置的热图、基于鼠标移动轨迹的热力图和基于内容点击的热力图。而这三种热力图的原理、外观与试用场景各有不同。
A. 基于鼠标点击位置的热图
与百度统计的页面点击图是类似的,用来记录用户在屏幕解析度的点击位置,而不同点是基于鼠标点击位置的热力图不会随着追踪内容的变化而变化,它只是用来记录相对时间内鼠标点击的绝对位置。
B. 基于鼠标移动轨迹的热图
类似于国外的 Mosestats、mouseflow 等,记录用户的鼠标移动、停留等行为,多为轨迹的形式。而和基于鼠标点击位置的热图相同的是,其也不会追踪内容的变化而变化,只会 记录相对时间内鼠标移动的绝对位置。
C. 基于内容点击的热图
类似于 Grwoinglo 热图,对用户在网页内容上的点击进行记录,自动过滤掉页面空白处的无效点击。而其最大的特点就是热图追踪内容变化而变化,并且记录用户在相对的时间内对内容的点击偏好。
实例:中国部分城
市GDP 热力图
工具:Folium
Folium 是 Python 中功能强大的数据可视化库,主要用于帮助人们可视化地理空间数据。使用Folium,只要知道其纬度和经度值,就可以创建世界上任何位置的地图。此外,Folium 创建的地图本质上是交互式的,因此可以在渲染地图后放大和缩小,这是一个非常有用的功能。
Folium 是 js 上著名的地理信息可视化库 leaflet.js 为 Python 提供的接口,通过它,我们可以通过在 Python 端编写代码操纵数据,来调用 leaflet 的相关功能,基于内建的 osm 或自行获取的 osm 资源和地图原件进行地理信息内容的可视化,以及制作优美的可交互地图。其语法格式类似 ggplot2, 是通过不断添加图层元素来定义一个 Map 对象,最后以几种方式将 Map 对象展现出来。
Python 实现过程
利用 Python 的开源模块 Folium 调用 open street map 生成 html。
利用 Python 爬取的互联网地图的经纬度坐标与统计局公布的年度 GDP 数据结合,构造 data(x, y, GDP),见下图。
通过颜色变化程度,图2直观地反应出热点分布,区域聚集等数据信息。我国主要城市里,GDP 较高的城市主要集中在东部沿海且分布较为密集,其中京津冀和珠江三角洲等东南沿海地区高 GDP 城市由为集中,西南和东北地区的城市 GDP 略低于第一梯度,西北与西藏地区 GDP 最低,基本符合我国各个主要城市和地区经济发展和发达程度的实际情况。
图 2:生成的 GDP 热力图
观察图 3 可以直观感受到热力图的交互作用。比较图中成都和重庆的圆圈大小以及颜色深度及层次,可以得出两地 GDP 结构相似的结论。
图 3:放大后的四川地区