240 发简信
IP属地:北京
  • 120
    0x09 文本相似性,词袋向量化

    摘要:机器学习处理文字、语音、图片、视频等任务,很重要的一点就是从原始信息中提取出机器可以理解的特征。一篇文章通常由大量的词语组成,在转换为向量的过程中,首先便会遇到抽取词语...