最近想训练专业领域的语料库,深度学习领域python的版本较多,国内普遍使用gensim来训练,而word2vec是Google提出的,Tensorflow上有例子实现。最近tensorflow越来越流行,所以考虑采用tensorflow来训练,可能能达到更快的训练速度,在技术方案上更符合主流。经过一周的实验,发现效果不如人意。具体如下:
-网上评估gensim的效果比tensorflow好很多。原文链接
-没有找到tensorflow运行windows上的word2vec说明,word2vec_basic运行没有问题,但高级版需要编译op。
-没有找到tensorflow上word2vec版本中的questions_words.txt中文方面的具体应用。
上述情况说明gensim在文本训练的难易程度、准确率方面比tensorflow示范程序里面介绍的方法好多了。但国内没有找到具体的原因,最后在stackoverflow.com上找到了一篇文章,详细说明了可能的原因,让我彻底放弃了tensorflow上实现word2vec的想法。
经过实际测试, gensim通过Cpython来实现底层算法,速度很快,简单易用。
Word2Vec 究竟选择Tensorflow还是 gensim
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1) 注...
- 情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析、归纳。情感极性分析主要有两种分类方法:基于情感知识的方...
- 作者 | 武维AI前线出品| ID:ai-front 前言 自然语言处理(简称NLP),是研究计算机处理人类语言的...
- 前言 本文根据实际项目撰写,由于项目保密要求,源代码将进行一定程度的删减。本文撰写的目的是进行公司培训,请勿以任何...