地址分词

地址分词和传统的NLP有很大区别。

基于地址分词和词性标注,可用在仓储物流系统,实现AI自动化,也可用在标准地址库建设中,实现地址标准化。

传统NLP技术用在地址分词上正确率和召回率都很低,对于地址“上海市上海市斜土路768号22层C座”,传统分词器切分结果如下,如果进行地址分词和词性标注,正确率是很低的。而专门的地址分词和词性标注系统能达到地址分词和词性标注准确率在99.1以上。

word分词器 的分词结果:上海市 上海市 斜土路 768号 22层 C 座

Stanford分词器 的分词结果:上海市 上海市 斜 土路 768 号 22 层 C座

Ansj分词器 的分词结果:上海市 上海市斜土路 768号 22层 c 座

HanLP分词器 的分词结果:上海市 上海市 斜 土路 768 号 22 层 C 座

smartcn分词器 的分词结果:上海市 上海市 斜 土路 768 号 22 层 c 座

FudanNLP分词器 的分词结果:上海市 上海市 斜土路 768号 22层 C座

Jieba分词器 的分词结果:上海市 上海市 斜土路 768 号 22 层 c座

Jcseg分词器 的分词结果:上海市 上海市 斜 土 路 768 号 22 层 c座

MMSeg4j分词器 的分词结果:上海市 上海市 斜 土 路 768 号 22 层 c 座

IKAnalyzer分词器 的分词结果:上海市 上海市 斜土路 768号 22层 c 座

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 我是个路痴,也有点脸盲症。不知道脸盲症和路痴搭不搭界。有人做过调查说五个女人里面有三个是路痴,不知道这个调查是不是...
    木土地阅读 4,996评论 24 39
  • 1. 还记得2014年马航MH370事件里,其中有一名女孩的老公就是乘坐这趟航班遇难的,而她一直期待着等他回家,迄...
    我有一个好故事阅读 10,808评论 27 111
  • 哪一些人不是你对的客户,你需要做减法把他们减掉的?请把这些人的特征详细描述出来(不低于500字) 我是来自江苏扬州...
    阳光明媚_f0a1阅读 1,449评论 0 0