Python实战计划学习笔记:爬取商品信息

之前装python3.5跟第三方库花了一些时间,总算弄好了,正式开始了学习。
加入实战计划的第二天,用BeautifulSoup爬取了一个网页的商品信息。
最终成果是这样子的:

Paste_Image.png

以下是我的代码:

Paste_Image.png

总结:
1.可能网页中有中文注释,起初一直爬不下来,后来在open方法里加了一个encoding参数。
2.在评级上面花了很多时间,尝试用count方法计数可是不行,后来还想用for循环来计数,后来看了参考答案才知道这么简单,直接用len()就可以了;
3.原先为什么要在评级的select路径用nth-of-type(2)没有弄清楚,现在大致懂了,这是div.ratings下面的第二个p标签。
4.用了一个for循环对抓取的标签进行遍历,这方面用法不太熟悉,要多练习。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容