作业: 1. 使用 selenium 或者 requests 模块抓取 华为商城荣耀9 https://www.vmall.com/product/738677717.html 的评论数据5000 条 ,保存到文件中 。
2. 使用snownlp 模块对 该文件中的评论进行分析, 统计出 5000条里面 积极的评论 和 消极评论的 数目, 区分出 积极和消极的
3. 使用 jieba 模块,统计出 文件中 出现最多的50个关键词,了解评论中大家最关心的手机哪些方面。
目的:
- 熟悉 selenium 或者 requests 模块
- 熟悉 大数据分析--- 文本分析的模块
要点 - selenium 取 body.text 或者 requests 取 返回的代码
- 了解 snownlp 方法 用法
- 了解 jieba 分词模块的用法
作业结果将在 下周一公布。