我的目的是成为一名人工智能相关的产品经理。
此书可以作为机器学习入门的教科书,豆瓣评分8.7。看完前两章的我,强烈推荐。清华大学出版,周华志著。
另:《图解机器学习》真的很坑,完全不适用于新手。
一、先前概念
开始之前,我们先了解几个概念,很多人只听过,却完全不知道其中的含义。
大数据,大数据挖掘,机器学习,深度学习,人工智能,这些概念的联系与区别。(都是我自己的理解,有不对的地方请指出)
首先,他们都是独立的概念。
1. 大数据
大数据,原指海量的数据。但现在人们口中的【大数据】,有了更深的含义。其中包括对海量数据的存储、传输、计算、分析等。
对大数据的这些需求,相对应的产生了一系列的大数据职位。如大数据分析师、大数据挖掘师(算法工程师)、大数据架构师等。
他们的主要工作就是对海量的数据进行有效的、有商业目的的存储、传输、计算、分析。
大数据要怎么用呢?依靠数据挖掘。
2. 大数据挖掘
大数据挖掘是指从海量数据中发掘出有价值的知识和规律。就是希望从数据中挖出金子,怎么挖呢?
对数据进行分析和利用,就涉及到对数据的“管理”和“分析”。
管理数据- 需要用到数据库。
分析数据- 需要用到统计学和机器学习。
统计学领域经常需要经由机器学习,产生有效的学习算法,再将算法应用到数据挖掘中。
3. 机器学习
因为人类没有办法从海量数据中总结出一些规律,所以需要依靠机器的高计算能力,帮助我们得出我们想要的答案。
机器学习,就是机器(计算机)自主学习,通过大量的数据学习到一些规律或模型(这些我们无法用人脑计算出),这些规律或模型可以判别新的数据,甚至推测出未知数据,预知未来。英文缩写ML。
因为机器学习可以应用到不同领域,比如语音,图像,视频等,对应产生了不同的学习方法和研究领域,比如计算机视觉、语音识别等。
我们只要知道,这些都是属于机器学习的领域即可。
那怎么让机器学习呢?方法有很多,比较热门的是深度学习。
4. 深度学习
深度学习,属于机器学习最热门的一种方式。
它模仿了人脑,经过“很多层”的神经网络算法的深度学习,达到机器学习的目的。称为深度学习,英文缩写DL。
由于它在语音、图像上的识别能力很好,所以成为机器学习技术的首选。
值得一提的是,神经网络算法很久之前就有了,现在才火起来,有两个基本原因:数据大了,计算能力强了。
5. 人工智能
我们的终极目标,是人工智能。就是希望机器能够拥有人类的思维方式和逻辑,帮助人类更好的生活。
至此,我们已经了解了最最基本的概念。接下来,我们就根着这本书,一起开启机器学习的旅程吧~~
-- 原创,未经授权,禁止转载 2017.10.25 --