大数据产业发展创新技术新书《数据之翼》收录自然语言处理工具HanLP

在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。


图:大快搜索获评“2018中国大数据基础软件领域领军企业”

在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领中国大数据产业发展的创新技术》。在本书的第一章节收录介绍了大快搜索自主研发的Hanlp技术。


图:数据之翼-引领中国大数据产业发展的创新技术

Hanlp是由大快搜索高级研究员何晗主导开发的完全开源的项目,具有精度高、速度快、内存省的特点。

2014年,还在攻读日语本科的何晗(大快搜索高级研究员)一定没想到,机缘巧合研发的一款中文分词器,在随后几年中几经迭代,并在商用市场大放异彩。

而看似是“无心插柳柳成荫”的事情,却凝聚着何晗对Hanlp工匠式的锤炼。

Hanlp是由一系列模型与算法组成的工具包,目标是普及自然语言处理(NLP)在生产环境中的应用。Hanlp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点:能够提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 安装stanfornlp 准备条件 win10 + jdk8(java安装包) + anaconda3 • 1)安...
    lanlantian123阅读 1,969评论 1 0
  • 常用概念: 自然语言处理(NLP) 数据挖掘 推荐算法 用户画像 知识图谱 信息检索 文本分类 常用技术: 词级别...
    御风之星阅读 9,372评论 1 25
  • 深夜中,又吵架了。起因是他伸手向她要钱,理由是你赚得多,理应多交些生活费。她没有答应。于是战争爆发了。说是战争,其...
    伊依芜蘅阅读 286评论 1 1
  • 直觉判断的输赢 学不会我会下象棋,国际象棋不懂规则但是蒙着也在电脑上玩过几局,因为可以根据中国象棋的规则去猜测一下...
    查理大魔王阅读 213评论 0 0
  • 我呱呱坠地的那一刻 正是你疼痛难忍的时刻 可你还是会忍着疼痛 望着她笑 后来 你总会细心照料 关注她的成长和变化 ...
    播音1802B李钰婷阅读 498评论 0 0