python爬虫之阿迪达斯天猫旗舰店所有男子商品获取

电商是爬虫不可略过的去处。
目标天猫旗舰店,将阿迪达斯天猫旗舰店所有男子商品名称及价格信息获取下来。

开发环境

  • python3.7
  • requests模块
  • lxml模块
  • json模块
  • mysql模块

获取分析

页面多请求多还复杂,找到这个URL可真不容易,毕竟是天猫。
能发现所需的数据虽然是通过异步加载得到,但并不是理想的json格式。
除此之外还能发现,jsoup,是java的html解析器。
用lxml同样能解析!

    response = requests.get(url,headers = headers).text
    html = etree.HTML(response)
    itemsname = html.xpath("//div/div[3]/div/dl/dd[2]/a/text()")
    itemsprice = html.xpath("//div/div[3]/div/dl/dd[2]/div/div/span[2]/text()")
    for name in itemsname:    
        itemname.append(name.strip())
    for price in itemsprice:    
        itemprice.append(price.strip())

所需数据已经抓取下来。
最后通过pymysql模块将数据保存下来。

结果展示:


(阿迪达斯天猫旗舰店一共4520件男子商品(目前)。后续商品数量或许不止4520件,会有所增加。)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 码字只是爱好兴趣, 心情总要落款纸笔。 字里行间写透你我。 渣男行径透支信誉。 女人没有柔水秘密, 男人低品刀割爱...
    咪咪139318阅读 428评论 3 14
  • 我也没搞明白我是如何在睡梦中思考问题,思考得我醒了过来,然后继续思考。[憨笑] 突然发现简单又复杂的家庭生长环境和...
    薄荷大栗子阅读 471评论 0 0
  • 曾经帮亲戚家卖鞭炮的时候,说起了找零的话题,说要是找钱,先找零钱,在找整的,也许顾客没有等到你给他整钱,他就...
    盖金辉教育碎思阅读 841评论 0 7
  • 正月初一伊始,到了最让人们头疼又高兴的日头。通常成家的男女夫妻是基点,拜年从他们的人际关系开始,先拜娘家人。小卫家...
    疙瘩尔阅读 443评论 2 1