Lec1-1 引导
机器学习是理论和方法结合的一门学问。
理论(道)
机器学习方法的假设、推论、结论、作用。是前辈设计的漂亮数学及算法。
缺点:可能会让你觉得不够实用。
方法(术)
机器学习不缺方法。每天都有几十几百个新的方法在产生。
缺点:若只是快速学使用方法,招数虽多,临阵时可能不知道如何妥善选择和使用方法。
课程设置: 从基础切入
哲学:机器学习的思想
数学:工具
算法:设计和使用
学会这些,把机器学习变成你的工具,而不是你是它的奴隶。
课程主题:When Why How Better
- When 什么时候可以用得上机器学习
- Why 为什么机器学习会有用
- How 机器怎么样可以学到东西
-Better 机器怎么样可以学得更好
Lec1.2 How 什么时候可以用得上机器学习
什么是学习
学习从观察出发,经过脑部内化,形成知识。
什么是机器学习
用电脑模拟生物学习的过程。电脑通过对数据进行观察,形成对自身有用的技巧。
什么是技巧
技巧是某种表现的增进。
如让电脑去预测股票,电脑预测的结果变好了,就说电脑是学到东西了。
什么时候使用机器学习
考虑:找出100条规则来定义一棵树(为了把规则实现为程序,让程序自动辨识一张图里是否有树)
人不是通过规则来辨识树的
小时候爸爸妈妈告诉你,这是树,这不是树,不会告诉你100条规则。人通过大量的观察,长得像这样的就是树,那样的就不是,得到内化的技巧(当前技巧是辨认一棵树)。
机器也需要自己学习
用大量的例子让机器自己去学,怎样去辨认一棵树,可能比你告诉机器100条规则要简单。这才是机器的学习,而不是人通过学习后再总结规则告诉给机器。
机器学习适用场景
使用场景举例
1. 人无法预知适用场景时:机器人在火星的行动策略。机器人需要自己在火星分辨当前所处的环境情况,再作出对应的行为。这个应对行为不是人设定好的程式,而是机器在地球上的训练中得出的技巧,然后到火星上进行泛化运用。
2. 人定义解决方案困难时(不知道写什么规则时):如视觉、声音的辨识
3. 人的分析时效局限时:如高频交易
4. 人的并发性受限时:同时为大量用户提供个性化服务
三个关键因素
机器学习像一个黑盒子,帮你屏蔽处理过程,你只用定好输入和输出,中间的过程它会去帮你学习。但它也不是任何场景适用,适用场景有以下三个关键因素:
1. 问题中有潜藏的可学习模式——有得学(人会做的事,机器才可能会做)
2.人很难定义规则——有必要学
3. 有与潜藏模式相关的数据——有原料
实例分析
1. 预测小婴儿下一次什么时候哭【不适用】——没有模式(人也不知道小婴儿什么时候哭,为什么哭)
2.识别graph里是否有圆圈【不适用】——人可以轻易定义识别规则
3. 决定银行要不要给用户发信用卡【适用】——有可学习的模式(人通过分析可以决策是否给当前用户发放信用卡),规则复杂(很难通过几行规则写下来),有数据(用户的收支情况、财产、债务、个人信息)
4. 预测地球会不会灭亡【不适用】——地球还没有灭亡,没有相关数据
Lec1-3 机器学习适用领域——方方面面
衣:时尚公司通过对用户的穿搭喜好调查和衣服的销售数据给顾客推荐衣服搭配
食:从Twitter数据(谁去哪哪家餐厅有没有拉肚子),推测餐厅卫生状况
住:用已盖成房屋的建筑形态特征数据,预测设计中的房屋盖好后的建筑形态,指导设计师修改设计使结果达到预期
行:无人驾驶自动车辨识交通提示的意思并决定行为
育:答题系统从学生的答题记录和题目的被答记录分析学生是否能答对某道题,保证题目对学生不要难太多
乐:推荐系统——根据用户看过的电影和电影的评价将电影推荐给刚好喜欢的用户。可能的方式: 用户的特征数据与电影的特征数据做内积。
财经:预测股票涨跌
医药:预测药效
法律:对法院公文进行自动摘要
……