先来爬爬POI_续

原文再续,书接上回

上一回是博主的处女作,大概讲了一下怎么用高德地图的API爬取POI数据。运行结果基本上就下边这样的:

上一篇的运行结果

发出去以后,有同学给我吐槽,说这个运行结果用着有点麻烦,想存成文件后边好用。想想也对,今天就给大家写一下怎么把解析好的数据存成文件,后边好用。

要存文件,首先呢,要创建一个文件。今天呢,我们就用最简单最常用的txt文件来写吧(主要是作者习惯了用txt)。创建一个txt文件也很简单,一句代码搞定

poifile=open("POI.txt","wb")

open函数的各个参数的具体含义,大家有兴趣可以自行百度,我在这就不多说了。

好了文件创建好了,下边就该把数据写到文件里边了,还是一句代码

poifile.write(poi["name"] +","+ poi["type"] +","+ poi["location"] +"\n")

写到这里是不是大家觉得可以了,就两句代码嘛,还值得写一篇。哈哈哈,你么啊,还是Too Young Too Naive。借用一位不可提及名字的人的话“有必要告诉你们一些人生的经验了!!!”。

直接写这两句话上去的话,运行结果是这样的


啦啦啦啦报错了报错了

到这步,其实你已经掉进py的坑里了。中文编码啊,当时我刚开始撸py的时候,中文编码也是把我虐的死去活来的。这又是一段心酸历史,有机会再说。

不过呢,写py有一个原则,遇到问题就找包,管他好包坏包,能解决问题就是好包。通过万能某度,我又找到了一个神包codecs。好了,把创建文件的代码改一下

poifile=codecs.open("POI.txt","wb","utf-8")

好了,运行走起。


结果

到这,你已经可以调用高德的API爬一定区域内你想要的POI数据了,数据到手后再怎么分析,我就不太懂了,结合业务具体搞吧。文末,引用一下老吴的话

      在高德API上进行。这不算一种正统的爬虫,因为爬虫的技巧和乐趣在于和被爬的网站进行博弈,要么你被封号封IP,要么你获得网页上有用的信息。而高德API及其类似的API,就像你要强奸她时,她反而大大方方把衣服解开,说您看,这是胸,这是腰,还有这是臀,您想模哪请自便。情趣立减三分!

     所以想提高爬虫技能,API不算是一个好老师,我个人的理解。

好了,写文件的坑填完了,下次有时间继续填异常处理的坑。

老规矩:有需要这部分代码的同志可以给我发邮件,大概介绍一下自己,然后说明要这部分代码就好了,当然了,开发者的KEY我可是不会给的,自己去申请吧。邮箱1373415867@qq.com

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 173,142评论 25 708
  • Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Ja...
    玩味Orz阅读 2,649评论 0 0
  • 我并不是想说:「互联网思维和成功学本质是一样的」,或者「互联网思维和成功学很像」,不,不是这样的。 实际情况是:互...
    GreeeenTsm阅读 323评论 0 1
  • 七孔竹筒嘴角傍, 孔播旋律好悠扬。 空山鸟语山回荡, 扬鞭催马送公粮。 (“空山鸟语","扬鞭催马送公粮"均为笛子...
    喷泉阅读 206评论 5 3