什么是机器学习(Machine Learning)
- 定义:计算机程序可以在给定某种类别的任务 T 和性能度量 P 下学习经验 E ,如果其在任务 T 中的性能恰好可以用 P 度量,则随着经验 E 而提高。
- 简单来说:机器学习是能通过经验自动改进的计算机方法研究
- 通俗的理解:机器学习,是计算的反问题(逆运算) (@张江)
机器学习和人工智能以及深度学习的关系
用一张图来表示:
- 深度学习是机器学习的子集
- 而机器学习是人工智能的核心
举个简单的例子:
先说说什么是计算:
- 计算房屋售价:给定输入,得到输出,如:已知房屋售价的平米数(如下图)
- 已知计算公式:房屋价格 = 面积 * 每平米售价(5000)
- 求房屋的售价
再来说计算的反问题(逆运算):
- 机器学习:有数据输入和输出,通过机器学习,得到模型
- 已知房屋的基础数据
- 已知房屋的售价
- 求房屋售价计算的模型
当房屋售价计算模型有了之后,就可以用户新数据的预测,例如:
当然这只是一个简单的例子,要真正预测房价,会涉及到的大量的参数,比如:几室几厅几卫,地理位置,周边环境,……等等,且机器学习得到模型也会更加复杂。
再举一个古老经典的例子
- 你去菜市场买芒果,印象中颜色靓丽的芒果,比暗淡的要好吃,于是你挑选了100个芒果,付款,开开心心回家了。
- 结果回家吃了之后,你发现其中25个芒果不好吃,觉得根据颜色来分辨太片面了,但是吃的过程中,你又发现了大个的50个芒果都好吃,小个的芒果只有25个是好吃,你总结出大个的比小个的芒果要好吃。
- 下次出门时,你要买更大个以及颜色更靓丽的芒果,结果发现常买的店铺关门了,只能去别家买,结果两家的产地不一样,买回来100个芒果,反而是小个的颜色暗淡的好吃。
- 为了吸取教训,买到更多更好吃的芒果,你采用了「机器学习」的方法,随机在市场买了1000个芒果:
- 列出芒果的属性:颜色,大小,形状,产地,经销商,等等,
- 以及对应的:甜度,成熟度,是否多汁,等等
通过1000个芒果的数据,得到了一个模型,在下次购买的时候,你只需要输入相关的数据,就可以判断出芒果是否好吃概率,通过大量的筛选,你购买了一批「好吃」概率在95%以上的芒果,结果是个个非常好吃,你也成了众人敬仰的「芒果吃货(专家)」。
通过这两个例子,是否对于机器学习有了初步的认知呢?
如上图:机器学习对于数据运用,相当于人的大脑对于经验的运用
实际项目中机器学习工作方式
- 选择数据:将你的数据分成三组:训练数据、验证数据和测试数据
- 模型数据:使用训练数据来构建使用相关特征的模型
- 验证模型:使用你的验证数据接入你的模型
- 测试模型:使用你的测试数据检查被验证的模型的表现
- 使用模型:使用完全训练好的模型在新数据上做预测
- 调优模型:使用更多数据、不同的特征或调整过的参数来提升算法的性能表现
机器学习都有哪些学习方式?
涉及到机器学习相关知识:
- 监督学习:需要“标签”当老师,明确要预测什么。
- 无监督学习:不告诉机器正确答案,让机器自己学习,给出结果。
- 半监督学习:训练的数据,只有一小部分是标记过的,大部分是没有标记。
- 强化学习:通过反馈,边实践边学习。
- 迁移学习:在某个垂直领域训练完成后,移致去其他相关领域调优发挥作用。
以及这一波人工智能浪潮兴起的主要原因之一:
- 基于人工神经网络的深度学习。
今天先简单介绍一些机器学习的基础概念,后续会针对上述机器学习的方式进行详细一些说明。
AI PM认知系列的相关阅读:
第一篇:从0开始搭建产品经理的AI认知体系
第二篇:产品经理的AI知识框架:计算机视觉
第三篇:产品经理的AI知识框架:语音识别与合成
作者:兰枫,前腾讯游戏,新浪微博PM,Elex产品总监,连续创业者。