之所以有这个想法想分享自己所学习的知识,是因为一个很喜欢的导师说过:
检验学习是否真的掌握并应用的方式是分享
所以这是第一篇学习 MachineLearning ( Andrew Ng )尝试的分享篇~
Definition
目前关于机器学期比较公认的两种定义:
Arthur Samuel (1959) : Field of study that give computers the ability to learn without being explicitly programmed.
Arthur Samuel 主要想表达的是机器可以在无设定的条件下自主地学习,像人类对待未知的事物一样进行自主学习。这是一个对机器学习一个相对抽象的概述。
Tom Mitchell (1988) : A computer program is said to learn from experiece E with respect to some task T and some performance measure P, if its performce on T, as measured by P, improves with experience E.
Tom Mitchell 在这边提出了机器学习分别于三个参量E、T、P之间的联系,即机器不断从E活动中获取经验来更好地更有能力地完成任务T,P则是度量机器完成T的优劣情况。这就好比如人通过下 n 盘围棋来提高自己围棋的赢的胜算,P则是度量这个人下围棋的成功率。Tom Mitchell 将机器学习的定义更加细化了分工了,Amdrew Ng教授则诙谐地说这个定义可能是谐音有趣。
classification
机器学习算法主要有两大类:
—— Supervised learning (监督式学习)
( the idea is that we're goring to teach the computer how to do something)
—— Unsupervised learning (非监督式学习)
( the idea is that we're goirng let it learning by itself )
Others: Reinforcement learning, recommender systems
监督式学习主要是机器知道正确答案地学习,即邮件可判断为是垃圾邮件与否,标准答案已有,机机器则在已知答案的数据集中不断学习。
非监督式学习则不知道答案,只给数据集,让机器自主学习给出数据结构或解决公式。
Supervised Learning
Definition: in every example in our data set we are told what is the "correct answer" that we would have quite liked the algorithms have predicted on that examples.
在多个属性x的影响下,结果有圈有叉,圈与叉即为在不同情况的正确答案,机器便在这些已有的数据集中不断学习,“监督”主要体现在“正确答案”。
regression problem: predict a continous(连续) valued output.
classification problem : predict a discrete(离散) valued output.
回归问题与分类问题主要区别是结果是连续的还是离散的。
Unsupervised Learning
监督与非监督看是1-1 与 1-2 中的结果是否标识为不同的结果。
非监督式学习一般与分类算法一起运用。
好啦,第一次可能自己的理解表达有些生涩,表达得词不达意或者模糊的,后面自己好好加油~