用 Python 解析李小璐的微博,惊呆了!

2018 年的开始就被娱乐圈李小璐事件刷爆网络,对于这件事我们用数据说话。我们就运用 Python,来看看各大媒体,是怎么谈论这个事情的,运用 Python 抓取新浪微博,根据关键字“李小璐 PGONE”,能够搜索到700 条热门微博(这个并非一切的,而是当前新浪微博可查询的)。

下面我们来看新浪微博媒体发布数据截图


热门微博生成的词云

从词云中,我们能够看出,这个事件中,涉及到的人物有李小璐、PGONE、贾乃亮、王思聪、卓伟、马苏,其中,最无辜的是李小冉同学,由于姓名相似,也被网友火热光临了一把。
涉及的人物词频

李小璐回复该事件的微博
直接抓取转发的 4.5 万用户谈论,然后计算词频绘制词云,如下图所示:

网友谈论词云

能够看到,网友们的态度主要是会集在厌恶、出轨以及相信、喜爱这两种态度上,但是呢,在网友的词频里面,竟然很少提及到 PGONE,也就是说,在李小璐的微博下面,我们都是在讨论李小璐和贾乃亮的爱情啊。
下面给大家讲一个利用 Python实现新浪微博爬虫的例子。第一个模块,模拟登陆 sina 微博,创建 weiboLogin.py 文件,输入以下代码:


image



就分享到这个。

Python开发
原文链接:http://t.cn/RHkrlkW

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容