2018 年的开始就被娱乐圈李小璐事件刷爆网络,对于这件事我们用数据说话。我们就运用 Python,来看看各大媒体,是怎么谈论这个事情的,运用 Python 抓取新浪微博,根据关键字“李小璐 PGONE”,能够搜索到700 条热门微博(这个并非一切的,而是当前新浪微博可查询的)。
下面我们来看新浪微博媒体发布数据截图
热门微博生成的词云
从词云中,我们能够看出,这个事件中,涉及到的人物有李小璐、PGONE、贾乃亮、王思聪、卓伟、马苏,其中,最无辜的是李小冉同学,由于姓名相似,也被网友火热光临了一把。
涉及的人物词频
李小璐回复该事件的微博
直接抓取转发的 4.5 万用户谈论,然后计算词频绘制词云,如下图所示:
网友谈论词云
能够看到,网友们的态度主要是会集在厌恶、出轨以及相信、喜爱这两种态度上,但是呢,在网友的词频里面,竟然很少提及到 PGONE,也就是说,在李小璐的微博下面,我们都是在讨论李小璐和贾乃亮的爱情啊。
下面给大家讲一个利用 Python实现新浪微博爬虫的例子。第一个模块,模拟登陆 sina 微博,创建 weiboLogin.py 文件,输入以下代码:
就分享到这个。
Python开发
原文链接:http://t.cn/RHkrlkW