我关心的主要是机器学习有什么用,对未来哪些行业,领域,应用会产生变革级别的影响。
为了了解这些,我感觉我首先要了解现在机器学习的主要方向,他们的主要应用,相关的主要工程工具。
机器学习跟线性代数和统计联系比较多,所以在做了解时,很容易一不小心就会陷入理论的坑中,不易自拔。
传统的机器学习有一套较完整的理论和算法,去scikit learning网站可以有个大致的了解,或者听下吴恩达老师那门基础ML课程(网易上就有)。
现在好像深度学习,强化学习等方向较火。如果有时间看大部头,当然不错,不过若是想快熟了解工程应用,我建议浏览下相关背景知识,比如神经网络知识就可,然后可以找些实际代码多看看可能更有帮助,比如tensor flow相关的例子,pytorch相关的例子,openai/gym里面的例子,等等。网上和GitHub上很多。
搞些具体的例子代码来感觉下,对了解深度学习,强化学习,还是比较容易的,但想深入点,或进一步到实际应用的级别,就挑战不少了。除了对相关库和框架有较好的了解(这个活本身就不是那么容易:) ), 又很容易让你不得不回到数学/算法相关的领域里。听有人提过,想让机器学习的库/框架成熟到一般的软件开发团队不需要有ML专家就可处理中等级别的实际项目,还得5-7年。目前好像Keras相对上手较快些。
一般网上的机器学习例子用用我们自己的小机器就好。但一旦项目化,不可避免的会用到GPU或云计算服务(比如AWS,阿里云,提供的学习环境/资源)。那些也不便宜,一小时1美元什么的,也不是我们个人玩的起的。这也是个问题,但个人比较乐观硬件价格的解决会比较快。
谈了这么多,其实还没聊到到底机器学习对我们日常工作有什么关系,继续跟踪。