我的第一个在线网页的爬虫出生了,感觉自己就是有黑魔法(黑科技)的养蛊的人。
我的代码和运行界面:
总结一下经验:
一、使用chrome解析网页源代码的时候,copy selector路径有时并不准,因为有些标签是动态加载的,其中的标签代码是自动生成的,与源代码并不一致,要得到准确的路径,最好还是分析网页的源代码。
二、BeautifulSoup解析网页返回的对象是一个类似的列表的对象,可以好像获取列表元素一样获取它的元素,如果该对象只有一个元素,就直接去它的[0]元素就可以了。
我的第一个在线网页的爬虫出生了,感觉自己就是有黑魔法(黑科技)的养蛊的人。
我的代码和运行界面:
总结一下经验:
一、使用chrome解析网页源代码的时候,copy selector路径有时并不准,因为有些标签是动态加载的,其中的标签代码是自动生成的,与源代码并不一致,要得到准确的路径,最好还是分析网页的源代码。
二、BeautifulSoup解析网页返回的对象是一个类似的列表的对象,可以好像获取列表元素一样获取它的元素,如果该对象只有一个元素,就直接去它的[0]元素就可以了。