初级爬虫使用指北 (0) --当我们在谈论【爬虫】

目录

  1. 写在前面
  2. 如何使用该指北
  3. 写作目的

1. 写在前面

如果只是需要完成一个常规的任务,请首先考虑使用成熟的【爬虫】软件,而不是自己写代码。 例如:八抓鱼采集器。其他请参考知乎-有免费的爬虫软件使用吗? 我使用过GooSeeker做简单的爬虫任务,还不错~

写【爬虫】代码意味着有特殊需求,而且该需求无法使用常规【爬虫】软件完成。一般而言,如果需要收集的数据可以在3小时内纯手工完成,那么这意味着不推荐使用【爬虫】进行任务。

目前这些教程都基于Mac系统-Python语言,Windows系统教程我目前还没有精力去完成(其实我有好久没用Windows系统工作了...哈哈哈哈我并不想在上面编程)。R和Java也可以写爬虫,不过我不会也不打算学。


2. 如何使用该指北

  • 先阅读分析需求,确定目前需求是否需要借助爬虫,

  • 再尝试安装所需软件(如果下定决心了)

  • 继而尝试建立第一个最简单的爬虫

  • 最后开始拓展自己的爬虫。

  • 可以根据自己具体的情况找一些实际案例的网络教程,知乎/简书/CDSN上都有很多


3. 写作目的

希望我的朋友们能充分使用数据来助力自己的事业,享受数据为我们带来的好处。同时也为了使我的朋友们能够专注于自己的优势,尽可能地在辅助工作(比如说数据收集)方面减少时间花费。

同时,这也是Arthur与我将知识框架落地的一个尝试,后续还有其他教程,包括并不限于:

  • Docker 虚拟机的另一种存在
  • Python-Flask 轻量级Web框架
  • R 统计工作的利器
  • R ggplot2 / Python Matplotlib 科研/程序员风格的可视化图表工具

另外,这里没有无偿的信息收集代劳。

“在吗”
“在”
“能帮我收集一下这些数据吗,感觉你很了解爬虫,这对你来说应该很简单的,谢谢了”
“你上一句是什么?”
“在吗”
“不在”

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 社会屌丝小人物,浮夸自负重城府。 挤完地铁拼公交,吹着牛逼刷微信。 蝇头小利分毫算,鸡毛小事来回翻。 得过且过平庸...
    ACG风景阅读 525评论 0 51
  • 如果说互联网的出现,加速了人们的沟通效率,缩短了世界距离,带来的诸多便利。那么,比特币则在依托互联网基础上,通过技...
    法明_52d3阅读 274评论 0 0