1:统计学习方法概论
1.1:统计学习特点,统计学习是关于计算机基于数据构建概率统计模型并运用模型进行数据分析和预测的一门学科。统计学习也称为统计机器学习
西蒙学习的定义:“如果一个系统能够通过执行某个过程改进他的性能,称之为学习”,按照这一个观点,统计学习就是计算机系统通过运用数据及统计方法提高系统性能的机器学习
2:统计机器学习的对象
统计机器学习的对象是数据,统计学习对于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。(这里的同类数据是指具有某种共同性质的数据)。由于他们有统计规律性,所以可以有概率统计方法加以处理。
3:统计学习的目的
统计学习用于对数据的预测和分析,特别是对未知新数据进行预测与分析,对数据的预测可以使计算机更加的智能化,或者说使计算机某些性能得到提高,对数据的分析可以让人们获得新的知识,给人们带来新的发现。
对数据的预测与分析是通过构建概率统计模型实现的,统计学习总的目标就是考虑什么样的模型和如何学习模型,以使模型能对数据进行准确的预测与分析,同时也要考虑尽可能提高学习效率。
4:统计学习的方法
统计学习的方法是基于数据构建统计技术从而对数据进行预测和分步。统计学习是由监督学习,非监督学习,半监督学习和强化学习等组成,统计学习的三要素简称为:模型,策略,算法。
实现统计学习方法的步骤如下:
1:得到一个有限的训练数据的集合
2:确定包含所有可能性的模型的假设空间。即学习模型的集合
3:确定模型选择的准则,即学习的策略
4:实现求解最优模型的算法。即学习的算法
5:通过学习选择最优模型
6:利用学习的最优模型对新数据进行预测和分析
5:统计学习的研究
统计学习研究一般包括统计学习方法,统计学习理论,以及统计学习应用三个方面。统计学习方法旨在开发新的学习方法;统计学习理论在研究于探求统计学习方法的有效性与效率,以及统计学习的基本理论问题;统计学习应用的研究主要考虑将统计学习方法应用于实际问题中,解决实际问题。
6:统计学习的重要性
1:统计学习是处理海量数据的有效方法
2:统计学习是计算机智能化的有效手段
3:统计学习是计算机科学发展的一个重要组成部分