不规范的名称也可是一种词库资源

在对来自不同系统的数据做匹配时,不规范的实体名称是一种困扰,因为程序不能自动匹配,需要人工识别匹配,举个例子,“福建省能源集团”、“能源集团”,“福能”指的是同一家公司。
但在我们做完匹配后,这些反而可以变成了一种词库资源,让系统知道,这些名称是同义词,在用于全文模糊搜索时,可以关联到同一家公司上。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 泪湿罗衣洒泪别,风急雨骤,两重悲衾寒。 天若有情天亦老,萧萧微雨闻悲音。 一寸光阴一寸灰,世事无常,酒盏泪和流。碧...
    空城锦阅读 1,722评论 0 0
  • 列车在黑暗中疾驰,一路摇摇晃晃,哒哒的轮轨撞击声,是给旅客的催眠曲。每到一个站口,乘务员认真的送走一批陌生人,又接...
    散文陌客阅读 1,495评论 0 0
  • -写给所有离家远行的游子,无论身处何方,家就在那里,等你们归来。 18岁 她是一座挣脱不开的牢笼 陈旧得像未庄 少...
    三苓阅读 1,261评论 1 2