百万级中文人名语料库

中文人名语料库(Chinese-Names-Corpus)

包含120万常见中文人名;25万古代中文人名;1万日本常见人名;2万英文常见姓或名;1千个中文姓氏;5千称呼词根,18万中文称呼;48万翻译人名。

可以用作分词字典,或人名识别训练语料。

GitHub地址:wainshine/Chinese-Names-Corpus

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容