StanfordCoreNLP 使用笔记

1、在使用 StanfordCoreNLP (下面简称为:nlp) 的时候,如果在使用完不关闭服务的话(调用 close() 方法),那么 nlp 是不会主动关闭服务进程的

2、一个 nlp 服务进程大概占用的内存为 4g 

3、可以通过参数 memory 来指定 nlp 服务所占用的 内存,可选的值为 4g、6g、8g。值得注意的是,并不一定会占用指定的 memory 这么多内存,

而是以实际占用内存为主。例如如果指定的参数 memory 值为 4g,但实际使用的内存仅为 1g,则 nlp 服务会只占用 1g 内存,而不是 4g

4、在定义 nlp 时是不会加载资源的,而是在使用的时候才会加载资源。例如分词的时候,在定义 nlp 时不加载资源,而是在使用 word_tokenize 方法来进行分词时才加载资源。并且仅在第一次的时候加载资源,在第二次及之后的调用中是不加载资源的。

5、nlp 加载资源的时间约为 8.5 秒(在使用 word_tokenize 时是花费这么多时间,其他方法还未测试过)

6、在不包括第一次调用 word_tokenize 的情况下,分词所花费的平均时间约为 0.1 秒

7、word_tokenize 不支持自定义字典

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容