第五章:
1,常用的分类和预测算法
2,回归分析
3,主要回归模型
4,决策树算法:
tip:使用dot -Tpng data.txt -o data.png 可以将生成的树用Graphivz进行可视化。(目前会出现编码问题,还没解决)
5 ,人工神经网络算法:
6,分类与预测算法评价
6.1 绝对误差和相对误差
6.2平均绝对误差
6.3均方误差
6.4均方差误差
6.5 平均绝对误差
6.6 Kappa统计
6.7识别准确度
6.8 识别精确度
6.9 反馈率
7,分类预测模型分类和预测
8,常见的聚类方法
9, 常用聚类分析算法
10, 连续属性与相似性的度量
11, 度量样本之间的相似性可以使用距离来算
12,文档数据
文档数据使用余弦相似性度量,可以建立一个词频表
13,目标函数
14, 聚类函数列表:
15, 关联规则算法:
16,时间序列模型
17, 时间序列的预处理
首先对其的纯随机性和平稳性进行检验
18,主要时序模式的算法: