机器学习 组成
主要任务
分类:将数据划分类别。
回归:主要用于预测。
分类和回归属于监督学习。
无监督学习:聚类,密度估计,降维。
训练的概念
监督与无监督算法的汇总
算法开发流程
- 收集数据: 收集样本数据
- 准备数据: 注意数据的格式
- 分析数据: 为了确保数据集中没有垃圾数据;
如果是算法可以处理的数据格式或可信任的数据源,则可以跳过该步骤;
另外该步骤需要人工干预,会降低自动化系统的价值。 - 训练算法: [机器学习算法核心]如果使用无监督学习算法,由于不存在目标变量值,则可以跳过该步骤
- 测试算法: [机器学习算法核心]评估算法效果
-
使用算法: 将机器学习算法转为应用程序
NumPy库
NumPy库存在两种不同的数据结构(矩阵Matrix和数组Array)
random.rand(4,4)
表示生成4X4随机数组。
mat()
函数将数组转化为矩阵。
.I
表示求逆
from numpy import *
random.rand(4,4)
randMat =mat (random.rand(4,4))
randMat.I
[参考链接] (http://ml.apachecn.org/mlia)