机器学习简介
-
祖师爷
- 艾伦.图灵,人工智能之父。其最大的成就就是图灵测试。一个人和一个机器跟你去聊天,你不知道对方是人还是机器,如果经过聊天后,你分辨不出谁是人谁是机器则说明这个机器通过了图灵测试。
- 模仿游戏
-
人工智能和机器学习的区别?
- 机器学习是实现人工智能的一种技术手段
-
什么是机器学习?
-
官方解释:
- 机器学习就是从【数据】中自动分析获得【规律(模型)】,并利用规律对未知数据进行【预测】。
-
通俗解释
模型:特殊的对象。在对象内部已经被集成或者封装好的但未求出解的某种形式的方程式。
模型的作用:实现对未知数据的预测和分类。
-
样本数据:
特征:自变量。如楼层 采光率 面积
标签:因变量。如售价
-
样本数据和模型之间的关联
- 训练模型:将样本数据带入到模型,使得模型中的方程可以求出解。
- 模型实现的预测或者分类其实就是模型中方程计算出来的结果。
-
模型的分类:
- 有监督学习
- 样本数据必须包含特征和标签数据
- 无监督学习
- 样本只需要包含特征数据
- 有监督学习
-
-
样本数据(数据集)的载体:
- 通常情况下历史数据都不会存储在数据库中,而是存储在文件中(csv文件)
- 数据库存储数据存在的问题:
- 性能瓶颈:数据量级大的数据很难存储和进行高效的读写。
- 数据存储格式不符合机器学习要求的数据格式
-
样本数据的获取途径:
- kaggle:数据竞赛平台。
- UCI数据集:是一个常用的机器学习标准测试数据集,是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库
- sklearn
-
为什么需要机器学习
- 解放生产力:比如智能客服(不知疲倦24小时工作,还不用支付其工资)可以代替人工客服。
- 解决专业问题:比如医疗方面的【ET医疗】,可以辅助医生进行相关症状的判断,数据显示,人类医生的平均准确率为60%-70%,而当下算法的准确率已经达到85%。
- 提供社会便利:杭州的城市大脑,无人超市等等。
- 机器学习的价值体现
- 价值体现在各个方面:医疗,航空,教育,物流,电商......
- 让机器学习程序替换手动的步骤,减少企业的成本也提高企业的效率。
- 例子:汽车销售在对新车进行推广的时候,一般都是将宣传手册投放给了所有的客户,从中进行目标客户的定位。但是如果使用机器学习对客户进行指定分类,然后将手册可以根据分类投放到不同类别的客户中,则这样就大大增加了商业机会。