手把手教你完成一个数据科学小项目(7):经纬度获取与BDP可视化

前言

请先阅读“中国年轻人正带领国家走向危机”,这锅背是不背? 一文,以对“手把手教你完成一个数据科学小项目”系列有个全局性的了解。

本系列代码统一开源在GitHub:DesertsX/gulius-projects ,感兴趣的朋友可以先行 star 哈。

截至目前我们已经完成了数据爬取数据提取与IP查询数据异常与清洗评论数变化情况分析省份提取与可视化城市提取与可视化,本文将调用百度地图 API 获取地理位置的经纬度,并使用 BDP 绘制动态热力图。

读取数据

之前系列文章和代码的最后末尾均可自行保存每次操作后的数据,比如新创建的那些列等等。

import pandas as pd
df = pd.read_csv('Sina_Finance_Comments_All_20180811_Cleaned.csv',encoding='utf-8')
df.head(2)

百度地图

创建应用

本回使用百度地图开放平台的 API 获取经纬度数据,读者也可以试下用高德地图、谷歌地图等等实现。首先在百度地图开放平台(需登录操作)的“控制台”处点击“创建应用”;可以随意填写“应用名称”,比如:地图经纬度;在“IP白名单”处可按照提示填写 0.0.0.0/0,方便在不同的电脑上操作,然后点击“提交”即可创建成功。应用列表里生成了应用,而访问应用(AK)就是后面调用 API 时所需的参数。

获取经纬度

Web服务API中找到所需的服务,本次是根据地理信息获取经纬度,于是正/逆地理编码,按照服务文档的说明,调用API。注意调用次数的限制。
正/逆地理编码 - 百度地图Web服务API

import requests
def area2coor(area):
    ak = '换成你的ak' # 应用列表里访问应用(AK)的一串字符
    try:
        # http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-geocoding
        address = area
        url = 'http://api.map.baidu.com/geocoder/v2/?address=' + address  + '&output=json&ak=' + ak
        json_data = requests.get(url = url).json()    
        coor_loc = json_data['result']['location']
        return coor_loc
    except:
        return "nocoor" # 不换ak多半都是 'nocoor'
    
print(df.loc[0,'area'])    
area2coor(df.loc[0,'area'])

经纬度

上面先测试下,能拿到经纬度后,创建经纬度列:

%%time
df['coor_loc'] = df.area.apply(area2coor)
df.coor_loc

拆分经度纬度

选出非'nocoor'的数据,再分别拿到经度和纬度,然后就可以导出数据,以便后面在BDP里操作。

df_coor = df[df['coor_loc'] != 'nocoor']
df_coor['lng'] = df_coor['coor_loc'].apply(lambda x: x['lng']) # 经度
df_coor['lat'] = df_coor['coor_loc'].apply(lambda x: x['lat']) # 纬度
df_coor[['lng','lat']]

保存数据

df_coor.to_csv('Sina_Finance_Comments_All_20180811_toBDP.csv', encoding='utf-8', line_terminator='\r\n')

动态热力图

古柳以前也用过 BDP,所以这回拿到数据后,就想着间隔近一年的时间后重新绘制动态热力图,虽则早已生疏了,但以前机智的写过一篇“使用手册”:(送福利)BDP绘制微博转发动态热力图,于是按照文中步骤很快就重新捡回并制作出来了。

具体步骤就不截图演示了,更详细的步骤请参考上面给出的文章,内含爬取的微博转发数据集,可供把玩(用Gephi一则热门微博的14层转发网络图谱:《Gephi绘制微博转发图谱:以“@老婆孩子在天堂”为例》):

此处仅记录大致操作步骤如下:

  • 网上搜索:BDP个人版,注册账号以便使用;
  • 点击“数据源”,点击“立即添加”,点击“CSV上传”,按照跳出的页面,上传本地对应的CSV文件,“逗号”分割,确定后,等待上传成功后,就能看到数据,此处将相应的时间列,设定为日期,否则后面动态展示时可能会出错。点击下一步,改不改文件名,目录,随意,之后下一步,完成数据上传;
  • 点击菜单栏右上角“新建图表”,选择“经纬度地图”后确定;
  • 经度选择上传的CSV数据里的“lng”列,纬度选择“lat”列,坐标系选择为百度地图;
  • 将工作表中文件拖曳到图层里,就能在地图上加载出数据,非常简单地拿到了地图;

更改设置参数,以便录制 GIF 时展示效果更佳:

  • 热力半径:8像素
  • 时间粒度:按时
  • 时间间隔:2小时 / 1小时
  • 自定义速度:FPS:8 / 12

可根据数据量、数据展示的效果、以及自身的要求自行修改。最后就拿到了文章评论的动态热力图,还是蛮酷的。


本系列代码统一开源在GitHub:DesertsX/gulius-projects ,感兴趣的朋友可以先行 star 哈。

本系列文章:
“中国年轻人正带领国家走向危机”,这锅背是不背?
手把手教你完成一个数据科学小项目(1):数据爬取
手把手教你完成一个数据科学小项目(2):数据提取、IP 查询
手把手教你完成一个数据科学小项目(3):数据异常与清洗
手把手教你完成一个数据科学小项目(4):评论数变化情况
手把手教你完成一个数据科学小项目(5):省份提取与可视化
手把手教你完成一个数据科学小项目(6):城市提取与可视化

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容