《机器学习实战》笔记(一):Ch1 - 机器学习基础

第一章 机器学习基础(代码)

  • 熟悉Python即可。

  • 开发机器学习应用程序步骤

    • 收集数据

      • 制作网络爬虫从网站上抽取数据、从 RSS 反馈或者 API 中得到数据、设备发送过来的实测数据等.
    • 准备输入数据

      • 必须确保数据格式符合要求.
    • 分析输入数据

      • 最简单的方法是用文本编辑器打开数据文件,查看得到的数据是否为空值.

      • 还可以进一步浏览数据,分析是否可以识别出模式.

      • 数据中是否存在明显的异常值.

      • 通过一维、二维、三维展示数据也是不错方法.

    • 训练算法

    • 测试算法

      • 对于监督学习,必须已知用于评估算法的目标变量值.

      • 对于无监督学习,也必须用其他的评测手段来检验算法的成功率.

      • 如果不满意算法的输出结果,可以回到第 4 步,改正并加以测试.

      • 问题常常会跟数据的收集和准备有关,这是必须调回到第 1 步重新开始.

    • 使用算法

      • 将机器学习算法转换成应用程序,执行实际任务,以检验以上步骤是否可以实际环境中正常工作。此时如果碰到新的数据问题,同样需要重复执行上述的步骤.
  • 掌握numpy函数库基础

    >> from numpy import *


代码托管见Github

笔记目录

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。