在对来自不同系统的数据做匹配时,不规范的实体名称是一种困扰,因为程序不能自动匹配,需要人工识别匹配,举个例子,“福建省能源集团”、“能源集团”,“福能”指的是同一家公司。
但在我们做完匹配后,这些反而可以变成了一种词库资源,让系统知道,这些名称是同义词,在用于全文模糊搜索时,可以关联到同一家公司上。
不规范的名称也可是一种词库资源
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。