机器学习中涉及的学习方式主要有四种:
1.监督学习
2.非监督学习
3.强化学习
4.半监督学习
区分:监督与非监督的区别在于学习中是用到的标签(label)
标签是指每个样本所属于的种类;
在监督学习中,就是根据已经有的数据来预测新的数据的正确性,那这个正确与否就是需要判断标签是否预测正确。从而来提高算法的性能。所以说,有监督学习,必须是有标签的。
主要用途:分类(Classify)和回归(Regression)
常见算法:k-近邻算法、决策树与随机森林、回归(逻辑、岭回归)、神经网络、朴素贝叶斯、支持向量机、线性回归等
而无监督学习,一般是归类,不用标签,把相近的样本归为一类。这个相似性就需要相似性度量。
主要用途:聚类等
常见算法:k-means,模糊c均值等
强化学习就是采用惩罚机制,评价行为,比如这是一个好行为或者这个是一个bad way。好的行为保持奖励,但是坏的行为就重处罚。从而经历重复的训练,效果也越来越好。
用途:游戏中比较好,比如蘑菇人,小鸟等,但是感觉也可以用于无人驾驶,市场还是很广的,还记得看过一个视频(吴恩达在斯坦福做过的一个实验就是一个自己会飞的飞机,效果还不错)。
半监督学习,是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。也就是以少量的标签来评判,进行归类。
机器学习--TEP
T-是样本,E-经验,P-性能,就是程序利用E在T上获得性能P的改善,这个就是学习。
总结:本人是个刚入行的小白,希望大佬指正,谢谢。