一、统计学习以及监督学习概论：

1.统计学

是一门关于计算机基于 数据构建概率统计模型并运用模型对数据进行预测与分析 的学科。

让机器从数据中学习一些知识，再从中进行预测（从已知到未知 ）

统计学习的分类方式

分类方式：根据学习的数据中所包含的标注信息来区分。
（1）监督学习：
从标注数据中学习预测模型的机器学习问题。其本质为学习输入到输出的映射（两个集合中元素相对应关系）的统计规律。

预测模型： 对给定的输入产生相应的输出（映射）；
输入/出空间： 输入/出的 所有可能取值 的集合；
特征空间： 所有 特征向量 存在的空间，其每一维对应于一个特征，有时候假设输入控件与特征空间为相同的，而有时会假设不同（核技巧）；
实例： 每个具体的输入，通常由特征向量表示；
样本： 输入与输出对——回归问题 是 输入/出皆为连续变量 的预测问题、分类问题 是 输出变量为有限个离散变量 的预测问题，而 标注问题 是 *输入/出变量结尾变量序列（多个变量）的预测问题；
基本假设：假设输入与输出的随机变量X和Y都遵循联合概率分布P（X,Y）
学习目的： 找到最好的由输入到输出的映射模型

监督学习流程图

通过学习所得模型分为 *条件概率分布P（Y|X）或决策函数Y=f（X)
那么预测系统对于给定的预测输入x n+1则由模型y n+1 = agr max(y) P(y|x n+1)/ f(x n+1)给定相应的输出（取max是为了确保可能性最大的）

*** （2）无监督学习：***
从无标注数据中学习预测模型的机器学习问题。其中，无标记数据是指自然得到的数据（只有输入，而输出为潜在数据）。其本质为学习数据中的统计规律或潜在结构。

*** （3）强化学习：***
指的是智能系统在与环境的连续互动中学习最有行为策略的机器学习问题。本质是学习最优的序贯决策。

强化学习流程图

流程： 在每一步t，智能系统从环境中观测到一个状态st与一个奖励rt，采取一个动作at。而环境根据智能系统选择的动作，决定下一步t+1的状态st+1与奖励rt+1；
目标： 长期累积奖励的最大化。

方法 = 模型 + 策略 + 算法

在 监督学习 中，模型就是索要学习的条件概率分布或决策函数。

若讲假设空间F定义为决策函数的集合：
F = {f|Y= f（X)} （f(x)=w(1)x(1) + ... +w(n)x(n)
这时F通常由一个参数向量决定的函数族：
F={f|Y=fθ(X),θ ∈ Rn}
其中参数向量θ取值于参数空间Rn（n维欧氏空间）；
若讲假设空间F定义为条件概率的集合：
F={P|P（Y|X)}
这时F通常由一个参数向量决定的分布族：
F={P|Pθ（Y|X)， θ∈Rn}
Rn同上。

按照什么样的准则学习/选择最优模型 （即学习目标）

（下面好多都是算式，就这样吧）