gensim中word2vec一些补充

存储和加载模型

存储、加载模型的方法如下:

>>>model.save('/tmp/mymodel')

>>>new_model = gensim.models.Word2Vec.load('/tmp/mymodel')

保存为txt格式：

model.wv.save_word2vec_format('wordvec.txt')

可以直接加载由C生成的模型:

model = Word2Vec.load_word2vec_format('/tmp/vectors.txt', binary=False)

#using gzipped/bz2 input works too, no need to unzip:

model=Word2Vec.load_word2vec_format('/tmp/vectors.bin.gz', binary=True)

可以在加载模型之后使用另外的句子来进一步训练模型

model = gensim.models.Word2Vec.load('/tmp/mymodel')

model.train(more_sentences)

不能对C生成的模型再训练

model.most_similar(positive=['woman','king'], negative=['man'], topn=1)

[('queen',0.50882536)]

model.doesnt_match("breakfast cereal dinner lunch".split())

'cereal'

model.similarity('woman','man')

.73723527

最后编辑于：2017.12.13 08:51:41

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文