适用于Python入门者的爬虫和数据可视化案例

本篇文章适用于Python小白的教程篇,如果有哪里不足欢迎指出来,希望对你帮助。

本篇文章用到的模块:

requests,re,os,jieba,glob,json,lxml,pyecharts,heapq,collection

首先

我们先进入到需要抓取的内容的地址:http://music.163.com/#

本文我们的目的

  • 抓取周杰伦的所有歌曲,
  • 歌词,
  • 以及评论

直接在搜索框搜索周杰伦

适用于Python入门者的爬虫和数据可视化案例

第一步:

抓取所有专辑 进入http://music.163.com/#/artist/album?id=6452如下图所示!

适用于Python入门者的爬虫和数据可视化案例

在谷歌浏览器的抓包工具(F12)里面查看交互信息发现如下:

适用于Python入门者的爬虫和数据可视化案例

如图所示:是我们需要的信息,知道这些事情就变得简单了

我们不需要用复杂的工具比如(selenium)去加载整个页面

事实上,如果还没想到抓取歌曲的方法,我估计就得用它了

我们再看header里面有什么

适用于Python入门者的爬虫和数据可视化案例

这里面的string就不用管了,因为它已经在我们的url里面了

只需要看request headers 这个就是我们给服务器发送的东西,

发送之后,服务器返回给我们的就是network里面的信息。

好,接下来我们伪造浏览器发送请求。

具体代码如下:

适用于Python入门者的爬虫和数据可视化案例

这里面用到了xpath来找到对应标签里面数据,

代码不重要,思想懂了就行(代码单独执行可行)

执行结果如下:

适用于Python入门者的爬虫和数据可视化案例

开始抓取歌曲信息

适用于Python入门者的爬虫和数据可视化案例

同样的道理我们通过伪造方式发送信息,获取歌曲信息!!

直接上代码

适用于Python入门者的爬虫和数据可视化案例

上面需要注意:xpath来获取需要的信息,利用正则来获取ID(其实有很多方法)

适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例

一样的道理,我们分析network来获取我们需要的信息歌词,评论!!

直接上代码

适用于Python入门者的爬虫和数据可视化案例

上面需要注意的是:利用json获取需要的数据(至少比正则快点)

适用于Python入门者的爬虫和数据可视化案例

数据分析,可视化

适用于Python入门者的爬虫和数据可视化案例

上面需要注意的是:我们合并数据的时候,可以选择性的删除一些无用数据

适用于Python入门者的爬虫和数据可视化案例

下面我们对周杰伦歌曲进行情绪化分析

适用于Python入门者的爬虫和数据可视化案例

下面完成数据词频各种分析

适用于Python入门者的爬虫和数据可视化案例

我们来看下结果

适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例
适用于Python入门者的爬虫和数据可视化案例

怎么样,学到了吗?看完记得动手操作哦!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 11,174评论 1 32
  • 脑袋里空的像什么一样,感受不到阳光感受不到温凉,存在于心底的灵感的根也被挖空了。想说,想爱,想冲出自己的束缚,想感...
    番茄战吼阅读 159评论 0 1
  • 今天是2017年10月28号,加班工作的周六。
    CharlenePeng阅读 147评论 0 1
  • 【E家汇】新货到!质量货!马来西亚三角燕,去年卖过口碑很好,回头率高!半斤起售,半斤35盏左右1980/半斤。
    Emily理事阅读 466评论 0 0
  • 生死之间有大恐惧 我们不知从何处而来 也不知道要向何处而去 不是昙花一现只为绽放瞬间的美丽 也不是顽石不朽可以展现...
    青道人阅读 153评论 0 0