我大概是十一月二十七号左右入职的。记得刚拿到offer的时候,是既开心又担心。开心的是终于拿到offer转行成功。担心的是,我能胜任这份工作么?
上班前的一周我得了重感冒,整个人都处于迷糊的状态。在这种状态下,我一个人拿着行李箱来到这个城市。我记得我来的那天,下了好大的雨。我在雨中淋了好久,终于招到了一辆的。上班的前三天,我都在看文档学习scrapy和mongodb。老实说,光看文档能够消化的知识很少很少,而且文档还是全英文的。后来,还是通过反复看例子,模仿例子来写demo才理解了这两个东西的用法。
我记得我拿到的第一个任务,是去某高校志愿网,把全国两千多所高校的信息都爬下来。网站大部分信息都在源代码里,部分可以通过后台抓包获得api入口,不算难。这个任务完成以后,马上我得从这两千多所高校里,爬取学生的QQ号码。这个一下子难到我了。难点不在技术。。。。而是,我去哪里爬?一天以后,我想到了可以去百度贴吧里通过匹配QQ号码来爬取。就这样,我写了个百度贴吧的QQ爬虫,从几百万个网页中爬取QQ号码。这让我很开心,觉得或许我并不是那么差劲,或许我真的可以胜任这份工作。可是我不知道,接下来有好多我没见过的事情在等着考验我。首先遇到的第一个问题是在服务器部署爬虫。我从来没试过在任务和服务器部署爬虫。我当时脑中以为部署爬虫和部署网站一样,要下载很多东西超级麻烦。我很紧张,怕别人知道我不会。我一整夜都在担惊受怕,上Q群里问别人有谁知道怎么部署爬虫,上百度搜如何部署爬虫。可是群里都是新手,百度也没找到答案。第二天,同事帮我下载了个xshell,连接服务器。然后,把爬虫扔进服务器,运行,完了。这么简单?我就为了这么简单的事担惊受怕一整夜!!!WTF!!接着我开始拼命的写爬虫了,也写的越来越熟练了。突然有一天,上头让我写个Flask的API用来上传图片。这个我又犯愁了,虽说我会点Flask。但是,那都是照狗书照抄的。我其实根本没理解里面代码的意思。这个要我在一周内搞定,为了这事我也是一整个晚上茶饭不思啊。第二天,我就突然顿悟了!我把一切想的太复杂,他要上传图片我就写个上传的功能进去不就得了。我花了一个上午就写好了,虽然有点low而且是单线程,不过将就用着吧。
我曾在知乎上看过一个问题“如何增加一个人的自信?”
经过这两件事以后,我觉得我已经适应了这个工作。我觉得我在段时间内成长了。我不再害怕了!上头开始让我爬视频网站,很多平台都要爬。有的没有PC端,只有手机端。每一个视频网的爬法都不一样,破解一个网站在思路可行的情况下至少也需要一天时间。但我的思想从“怎么办,这个我不会啊。别人万一知道我不会怎么办?”开始变成“这个东西我没见过,好像很有难度。让我来搞定他!”
自信,是这一个多月来我最大的收获。然后,我有了新的想法。我想学数据分析,想学机器学习。十二月中旬的时候我就找了一些关于pandas和机器学习的书。原定的计划是下班回家后继续学习。但是由于环境让我无法集中精力,所以学不下去。后来我开始尝试着更改计划。我住的离公司很近,周末我在家也很闲。而且公司环境比家里要好太多,所以我想周末也回公司学习写代码去。上个礼拜周末开始我就是在公司里待着了,只看了点关于k紧邻的算法,还没有找到实战用的数据。所以,只是了解了一下。不过感觉比在家看书效果要好,毕竟在公司我还可以大致了解一下。但在家里,我连了解的心思都没有。
把机器学习学会了,会不会很幸福呢?