数据说明: 本次爬取大众点评共8个字段信息,包括: 商户名字, 口味评分, 环境评分,服务评分,人均价格,评论数量,地址,商户星级
然后把数据存入excel表格
一 、首页部分
我们可以看到有很多分类 我们今天主要抓取的是分类里面的美食这一项。然后我们可以看到在美食这个分类下面还有很多的小分类,我们今天为了简介 就不一一的去处理这些小分类,而是通过点击美食来到这个页面
二、二级页面
然后点击搜索 ,出现的就是我们想要的商户信息了。
然后 我们可以通过python 的requests和beautifulsoup4 来解析到每一个商户详情页的链接。
通过简单的三行代码我们就能把每一个商户的url,这里应该我们匹配到的url只是链接的一部分,所以我们还需要对url进行一个拼接
这个时候url_list里面的url就全部是我们需要的url了。
三、详情页面
因为这个数据是直接加载出来的,所以我们可以用beautifulsoup 来直接解析我们需要的数据
然后就可以拿到我们需要的数据了。
最后附上运行结果和excel表格数据
有需要资料的可以加群:657598389