抓取千股千评

1.因为东财的数据是通过异步提取，所有可以以
用浏览器的开发工具 network-js-刷新的方式得到数据接口
分析后以 3426项为结束并用1页请求下来，避免东财的监控

2.使用scrapy 以 scrapy.Request 分两步爬取
1步爬取本页的基本数据
2步分析另一页的链接并爬取数据(以http://data.eastmoney.com/stockcomment/%s.html %s为股票代码得到详情页)

3 将两页的数据合并在一起存入数据库
4 定时更新时分为按股票代码如果存在就存储如果已经有了，就更新的原则

最后编辑于：2017.12.09 01:19:29

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

[3/4]我所经历的大数据平台发展史（三）：互联网时代 • 上篇
//我所经历的大数据平台发展史（三）：互联网时代 • 上篇http://www.infoq.com/cn/arti...
葡萄喃喃呓语阅读 51,605评论 10赞 200
阿兰德波顿温和的成功哲学
阿兰德波顿在Ted的演讲我经常对事业感到恐慌.周日下午，晚霞洒满天空，我的理想和现实的差距却是这样残酷，令我沮丧...
ChrisJO阅读 4,596评论 0赞 1

2017-08-18
上海的夜微凉，伴随着雨拍打着窗户，喜欢淅淅沥沥的雨声，喜欢下雨天享受一个人在家的时光，它让心里宁静，此刻的夜晚有点...
我们的青春故事阅读 1,225评论 0赞 0
曾经有人对我说，不知道的事就是不知道的话，迟早有一天，会铸成大错
首先，先来一个UC震惊部版的标题提提神：《震惊！退休刑警跟旅馆老板娘说了这个后，竟命丧黄泉》。是的，没错，不要...
弄雪过三川阅读 3,818评论 0赞 0
学会爱
最近在《有书共读》上读了徐小2拆读弗洛姆的《爱的艺术》一书，很受启发。这两天王宝强的离婚声明引发了网络各种刷屏。...
潇湘温柔夜阅读 1,688评论 0赞 0

赞1赞

赞赏

手机看全文

抓取 千股千评