2019-05-25

苏宁列表页及详情页

import scrapy

import json

import re

from copy import deepcopy

class JdSpider(scrapy.Spider):

    name = 'jd'

    allowed_domains = ['jd.com','3.cn','suning.com',"dangdang.com"]

    def start_requests(self):

        # url = "https://p.3.cn/prices/mgets?skuIds=J_11495238747,"

        # url = "https://pas.suning.com/nspcsale_0_000000000646340846_000000000646340846_0070167435_60_311_3110101_502282_1000095_9095_10638_Z001___R9011242_0.2___.html"

        # url = "http://product.dangdang.com/26920352.html"

        url = "https://list.suning.com/1-502322-0.html"

        yield scrapy.Request(

            url=url,

            callback=self.parse

        )

    def parse(self, response):

        book_list = response.css('p.sell-point a')

        item = {}

        for book in book_list:

            item['sa-data'] = book.css('::attr("sa-data")').extract_first()

            title1 = book.css('::attr("title")').extract_first()

            title1 += book.css('::text').extract_first()

            title1 += book.xpath('//em/text()').extract_first("")

            item['title'] = title1

            item['href'] = book.xpath('./@href').extract_first()

            yield scrapy.Request(

                url="https:"+item['href'],

                callback=self.parse_detail,

                meta = {'item':deepcopy(item)}

            )

    def parse_detail(self,response):

        item = response.meta['item']

        data = item['sa-data']

        url = "https://pas.suning.com/nspcsale_0_{}_{}_{}_60_311_3110101_502282_1000095_9095_10638_Z001.html"

        id1= "000000000000000" + re.search("prdid':'(\d+)','shopid':'(\d+)'",data).group(1)

        id1 = id1[-18:]

        id2= re.search("prdid':'(\d+)','shopid':'(\d+)'",data).group(2)

        url = url.format(id1,id1,id2)

        print(url)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 2月底3月初的时候,去厦门旅游。朋友送的美能达X700总是在旅行的路上才亮相多少有点对不住它。虽然相机玩儿不是很熟...
    一抹鱼肚白阅读 295评论 0 0
  • 有两个好朋友从小一块长大这里称为A和B,上学时两人都很优秀,分数相差无几相约考入了同一所大学,在当地传为佳话。毕业...
    Jessica王凌芸阅读 1,093评论 0 3
  • 多的是我不知道的事。 那这句话来形容我今年的感受再合适不过了。今天想说说我的室友兼好朋友徐小姐。 如果早夕相处的话...
    明初的日记本阅读 307评论 0 0