文本分类(多分类问题)

项目场景:

  • 简历,很多蓝领领域分类多,需要根据简历内容,进行智能分类
  • 转转,二手物品类目380-600左右的类目,需要根据内容进行智能分类,提示用户进行选择

工具:

  • 快速文本分类 fasttext

经验:

  • 类目太多,且严重不均衡,做分层抽样,效果不明显
    ref: 简历分类,分层抽样
  • 使用分词工具进行分词,与 不做分词直接切分字,效果提升1%
  • 类目增多,效果降低
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容