gensim中word2vec一些补充

存储和加载模型

存储、加载模型的方法如下:

>>>model.save('/tmp/mymodel')

>>>new_model = gensim.models.Word2Vec.load('/tmp/mymodel')

保存为txt格式:

model.wv.save_word2vec_format('wordvec.txt')

可以直接加载由C生成的模型:

model = Word2Vec.load_word2vec_format('/tmp/vectors.txt', binary=False) 

#using gzipped/bz2 input works too, no need to unzip:

model=Word2Vec.load_word2vec_format('/tmp/vectors.bin.gz', binary=True)


可以在加载模型之后使用另外的句子来进一步训练模型

model = gensim.models.Word2Vec.load('/tmp/mymodel')

model.train(more_sentences)


不能对C生成的模型再训练

model.most_similar(positive=['woman','king'], negative=['man'], topn=1)

[('queen',0.50882536)]

model.doesnt_match("breakfast cereal dinner lunch".split())

'cereal'

model.similarity('woman','man')

.73723527

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容