第一章 机器学习基础(代码)
熟悉Python即可。
-
开发机器学习应用程序步骤
-
收集数据
- 制作网络爬虫从网站上抽取数据、从 RSS 反馈或者 API 中得到数据、设备发送过来的实测数据等.
-
准备输入数据
- 必须确保数据格式符合要求.
-
分析输入数据
最简单的方法是用文本编辑器打开数据文件,查看得到的数据是否为空值.
还可以进一步浏览数据,分析是否可以识别出模式.
数据中是否存在明显的异常值.
通过一维、二维、三维展示数据也是不错方法.
训练算法
-
测试算法
对于监督学习,必须已知用于评估算法的目标变量值.
对于无监督学习,也必须用其他的评测手段来检验算法的成功率.
如果不满意算法的输出结果,可以回到第 4 步,改正并加以测试.
问题常常会跟数据的收集和准备有关,这是必须调回到第 1 步重新开始.
-
使用算法
- 将机器学习算法转换成应用程序,执行实际任务,以检验以上步骤是否可以实际环境中正常工作。此时如果碰到新的数据问题,同样需要重复执行上述的步骤.
-
-
掌握numpy函数库基础
>> from numpy import *