伙伴们注意了!
小编在这里给大家送上关注福利:
搜索微信公众号“速学Java”关注即可领取小编精心准备的资料一份!
英语文本几乎无处不在。
如果我们的系统能够理解并自动生成它,那将是最好的。
然而,理解自然语言是一项复杂的任务。
它是如此复杂,以至于许多研究人员花了一生的时间来做它。
现在,已经发布了很多工具来完成自然语言处理工作。
以下是我收集的8个工具。
我还验证了它们都被某些应用程序至少使用一次,因此它们都是可运行的。
有些来自工业公司,有些来自研究机构。
它提供了解析、自动查找主题等功能。
1.OpenNLP:一个Java包,用于进行文本标记、词性标记、分块等(教程)
2.斯坦福解析器:概率自然语言解析器的Java实现,包括高度优化的PCFG*和词法化的依赖性解析器,以及词法化的PCFG解析器
3.自然语言处理和机器学习。
4.雪球:一个stemmer,支持C和Java。
5.MALLET:一个基于java的包,用于统计自然语言处理、文档分类、集群、主题建模、信息提取和其他机器学习应用程序到文本。
6.JGibbLDA: Java中的LDA
7.Apache Lucene Core:一个用于删除和词干的Java库
8.斯坦福主题建模工具箱:CVB0算法等。