supervised learning:个人理解是根据已有的特征组来训练机器,让机器来预测出结果
eg1(线性关系举例):假设有一些房屋面积()对应的价格数据($),那么我们根据对应的坐标在坐标系上标上相应的位置,如下图:
房屋面积与价格对应图
此时我们想知道自己的房子的面积对应的价格是多少,那么
1、根据已有的值画一条直线 2、根据已有的值画一条曲线 3、......(当然还有很多其他的方案)
列举的两种方案
根据自己的房屋面积,在①②找出对应的点,此时我们会得到不同的价格,这就是预测价格
预测结果
eg2(离散关系举例,常用于分类问题的处理):预测肿瘤大小和肿瘤良性恶性的关系(左图,纵左边1为恶性,0为良性),或者预测肿瘤大小和年龄大小的关系(右图,X代表恶性,O代表良性)也可以来进行预测
unsupervised learning常用于聚类问题(特征值反映在坐标系上可能是一个个的圆圈或者其他的形状等等),还有一个典型的红酒聚会问题。
红酒聚会问题:如果多个人都在参加聚会,说话,那么怎么让机器分辨出“有用的信息”呢?