Python自动爬取淘宝网评论

#!/usr/bin/env python
# -*- coding: utf-8 -*- 

import json
import re
import urllib2
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

url='https://rate.tmall.com/list_detail_rate.htm?itemId=41464129793&sellerId=1652490016&currentPage=1'
cont=urllib2.urlopen(url).read()
rex=re.compile(r'\"rateList\":(\[.*?\])\,\"searchinfo\"')
content=rex.findall(cont)[0]

con=json.loads(content, "gbk")
count = len(con)
print len(con)
# count=len(con['rateDetail']['rateList'])

# print count
for i in xrange(count):
   print str(i) + " " + con[i]['rateContent']

最后编辑于：2017.12.05 00:11:35

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

用selenuim 爬取淘宝手机评论列表
爬得我真是累，我靠，还不如其他小网站一个scrapy爬，爽得一批，话说，不过反爬虫的网站应该是很多很多了真心爬得忧伤
简书用户9527阅读 1,826评论 0赞 0
Python新浪微博爬虫-2 爬取评论用户的信息
这篇文章是Python爬虫的第二篇，目标是新浪微博的评论人的性别，地区，等信息，写的不好的地方请指正。先来分析一...
matianhe阅读 6,497评论 4赞 105

用Python爬取美团外卖APP评论
一、介绍朋友暑假实践需要美团外卖APP评论这一份数据，一开始我想，这不就抓取网页源代码再从中提取数据就可以了吗，...
1想得美阅读 16,396评论 4赞 13
Python新浪微博爬虫-1 爬取评论、用户名、用户ID
这篇文章是Python爬虫的第一篇，目标是新浪微博的评论，本篇只实现了抓取评论者的id或个性域名，评论，用户名，详...
matianhe阅读 14,294评论 2赞 111
零基础脑图第四次作业
小组名称：飞雪静茗脑图说明中心图说明：这次作业是用思维导图记住朱自清的散文《匆匆》，这篇文章主要表达作者对时...
杨茗辞阅读 3,493评论 13赞 16

5赞6赞

赞赏

手机看全文