gensim word2vec 训练外部语料

随笔1、打开Anoconda自带的Spyder,这是一个可以交互的调试工具

2、训练外部文本语料集:

model = Word2Vec(LineSentence('E:\\spyder\\text8'), size=400, window=5, min_count=5)


图1

3、保存模型:

model.save('E:\\spyder\\text8.model')

4、保存成TXT文本:

model.wv.save_word2vec_format(r'e:\spyder\text8Vec.txt', binary=False)

5、等到使用的时候再将训练好的模型加载进来(模型的读取):

model = Word2Vec.load('E:\\spyder\\text8.model')

6、训练好的语料模型加载进来后就可以进行预测了:

model.most_similar("girl")

model["girl"]

model.similarity("girl","woman")

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 模型创建 Gensim中 Word2Vec 模型的期望输入是进过分词的句子列表,即是某个二维数组。这里我们暂时使用...
    chaaffff阅读 2,142评论 0 5
  • 首先通俗的解释下Topic模型LDA:假如我们需要写一篇关于新上市汽车的文章,首先需要确定文章大概的主题,比如要写...
    chaaffff阅读 1,988评论 0 3
  • word2vec介绍 word2vec是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向...
    空白_J阅读 12,328评论 1 6
  • 前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章,甚至之后...
    我偏笑_NSNirvana阅读 14,106评论 2 64
  • 从高中懂得记事时开始,五年前的寒暑假都是失败的,所以我不敢保证今年的暑假会成功,因此我也是抱着无我的心态学习。但是...
    浮生梦苏阅读 338评论 0 1