机器学习 - 使用监督学习模型对一段文本进行分类的基本过程

  • 前提假设
    已经有了一个学习模型f供我们使用
  • 函数f输出的类别是我们事先认为约定好的,比如使用数字2表示科技类,数字3表示体育类......
  • 训练过程


    训练过程

坊间有一句话:特征决定了机器学习的上限,机器学习的算法只是逼近这个上限--->

  • 特征工程的非常重要!

竞赛提供的文本训练数据集一般是脱敏数据集(即将机密或不宜公开的文字转换成数字或字母)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容