对“机器学习”有些兴趣,我今天特意向朋友请教了“机器学习”的知识。
1.机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。-来自百度百科
2.机器学习具体的一些应用,如红酒品质判定,预测当天天气状况,雾霾判别等。图一为机器学习生成模型的使用。
机器学习,通过处理海量的数据,利用机器学习的算法(逻辑回归,随机森林算法,决策树)对数据进行训练生成模型,对模型进行分析,并学习而创造新的结果,找出影响结果的因素,查找出人不容易找到的规律,帮助决策。
拿红酒品质判定来举例。将收集到大量“酒品成分与红酒品质好坏的结果”的数据,通过SQL语句进行处理,比如进行去除量纲,转换数据类型等,再利用归一化等算法进行数据的数据的拆分,使用算法训练数据生成模型,模型生成则可以利用模型对数据进行预测。
通过用大量的数据运用机器学习算法生成模型后,可以将该模型(类比成黑箱)用于实际的数据判断中。
3.机器学习的两种方式,无监督学习与监督学习
无监督学习,一开始不使用任何的数据,通过收集大量数据逐步养成模型,这是很理想的状态。
监督学习,建立模型的数据必须含有判断结果的。
4.机器学生成的模型不是一个数学公式,是封装好。模型确定后好,输入一组数据,即时可以收到判定的结果。使用这个模式应该是“检测到的数据,上传,立马返回判定的结果”,阿里是有这样的服务提供,有兴趣可以试试。