昨天算是稍稍修整了一天, 因为首先学姐那边的tensorflow代码暂时告一段段落, 基本调通;其次,爬虫代码已经愉快地开始运行啦(单线程单机版),也算是可以暂时歇一下了. 所以最近可能不会发什么关于爬虫的东西了(本来也只想涉猎而已,没想到随便一涉猎就碰到昨天那种狠角色....)等分布式的完全搭好之后再一起发上来把(可能需要很长很长的时间XD)
接下来一周的重点我可能会完全的放在算法上.
越接触这一行,越发现算法的重要吧.
稳拿google offer的葱娘对我说, 好好刷算法...跑到国外当人生赢家的哥对我说,好好学算法...实验室学姐每天忙的周末都呆实验室辛苦的为offer奔波, 其实也就是:好好学算法...看着他们线上笔试的题目以及李学长的建议,更坚定了我的决心:好好学算法.
深深地体会到, 其实算法与数据结构才是CS这一行真正的基础与王道, 思想有点类似于摩根企业的面试标准:
管它时代怎么变化, 管它现在哪一行更热门, 你把真正的数据结构和C++,Java等任何一种基础的编程语言掌握好了,就不怕会落伍
这也是为什么现在基本所有的BAT都需要java开发工程师和算法工程师的原因. 一通而百通, c++和java的开发模式检验了一个人的编程功底, 数据结构和算法说明了一个人的思维模式. 哪怕是现在最火的机器学习,其实本质也不过就是 语言+算法. 而且算法也占到了很大一部分. 真正算法好的切到机器学习应该也没什么压力的感觉..
更何况,越了解机器学习这一行,其实越明白变化之快. 机器学习的潮流大概有两拨, 第一波:浅层学习, 通过简单的分类器(线性回归,SVM)等方法规约大数据得到结论, 第二波:深度学习,探讨从神经网络中如何去挖掘一些隐藏的特征,如何去提升神经网络的效率, 深度, 防止梯度消失等东西. 之后又有了强化学习, 模仿学习, 深度强化学习.....
大概这些东西是学不完的,但是如果你的编程基础和数据结构基础很好, 这大概就是万能的.也是进入一个BAT所必需的.