爬取58上的手机号码信息

主要思路:
从列表页获取每个号码的详情页链接,然后在获取详情页链接的信息,把收集的信息保存到文档文件中或者保存在数据库中(主要使用的是MongoDB)

完成步骤:
1.获取详情页链接,

url = "http://bj.58.com/shoujihao/pn{}/".format(num)
        response = requests.get(url,headers=headers)

        time.sleep(1)

        soup = BeautifulSoup(response.text,'lxml')

        if num == 1:
            boxlist = soup.select('div.boxlist div.boxlist')[1]

        else:
            boxlist = soup.select('div.boxlist div.boxlist')[0]

        title = boxlist.select('strong.number')
        links = boxlist.select('a.t')

  1. 获取详情页的信息,
price = soup.find_all('span',class_='price')[0].text.rstrip()
        print price

        city = [i.string.rstrip() for i in soup.find_all('div',class_='su_con')[1].children][1]
        print city

        seller = soup.find_all('a',class_='tx')[0].string
        print seller

简单分析一下,看一下那种价格的数量最多(0表示面议)


show.png

完成。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容