感觉智商被碾压

下午复习高数之前看了一下码市,发现有一个腾讯证券网站的爬虫需求可以做,一方面需要抓取符合一定规则的文章,另一方面还需要抓取实时股票数据。两个要求都在能力范围内,于是投了标。
联系了需求方后开始尝试爬取。
文章列表和股票信息是js生成,于是花了点功夫分析http request。经测试,大功告成。
后被告知需要实时抓取全站七天内文章标题中含xxx的文章信息。遂尝试写关键字分词匹配功能且做好了增量全站抓取的打算(因为文章分类非常杂,找不到可以遍历全站文章的列表)。
做到这里,联系需求方告知进度和方案。未料其向我展示另一名投标者提供的demo操作视频。
惊呆,他竟然爬的是百度搜索。
好了,哥,我要复习高数了,拜拜。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 173,335评论 25 708
  • 爬虫文章 in 简书程序员专题: like:128-Python 爬取落网音乐 like:127-【图文详解】py...
    喜欢吃栗子阅读 22,005评论 4 411
  • 近些年来,国内生活水平提高,品味提升。商业街铺满高端广告,时尚杂志每一页都透露高端奢华四个字,人人追求高端大气有品...
    陈开莺阅读 444评论 0 0
  • 引子:我生于草上,活于山野。世人称我为淫濑——男人强奸过的女人所生下的孩子...... ...
    世上无花阅读 2,357评论 11 24
  • 初中的时候,同桌是位女同学,鼻尖长满了细小的黄雀斑,脾气很好。最大的优点就是名字很好听,叫做蜜枣,最大的缺点就是长...
    暖先森阅读 30,103评论 21 73