【word2vec】:三种不同格式的词向量的保存与加载

1.以model.save()方法保存词向量

保存词向量

import gensim
model = gensim.models.Word2Vec(documents, size=300)
model.train(documents, total_examples=len(documents), epochs=10)
model.save("../input/Word2vec.w2v")

加载词向量

import gensim
word2vec = gensim.models.word2vec.Word2Vec.load("./input/Quora.w2v").wv

2.保存为二进制的词向量

保存词向量

model.wv.save_Word2Vec_format(embedding_path,binary=True)
model.wv.save_Word2Vec_format(embedding_path,binary=False)#非二进制

加载词向量

import gensim
word2vec = gensim.models.KeyedVectors.load_word2vec_format(embedding_path,binary=True)

3.使用numpy进行保存和加载

保存数组数据的文件可以是二进制格式或者文本格式,二进制格式的文件可以是Numpy专用的二进制类型和无格式类型。

使用np.save()保存npy文件,np.load()加载npy文件。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • numpy 统计函数 从数组中查找最小元素, 最大元素, 百分位标准差, 和方差灯 numpy.amin()和nu...
    pigdaqiang阅读 4,870评论 0 7
  • 单元1:NumPy库入门 数据的维度 从一个数据到一组数据 一个数据:表达一个含义一组数据:表达一个或多个含义维度...
    YBOT阅读 4,218评论 0 1
  • 在上一篇中我们介绍了 mpi4py 中获得高性能 I/O 的方法和建议,下面我们将介绍 mpi4py 并行读/写 ...
    自可乐阅读 8,618评论 0 3
  • 送菩萨 末法之世浊气盛 慈眉善目人不解 霹雳金刚才醒脑 先送吾师回西天 待我杀完这一世 面朝佛祖把罪领 佛无相而相...
    纵情嬉戏天地间阅读 1,501评论 0 0
  • 最近白天睡觉,晚上醒着,就刷刷微博,想着吃东西,可又没有什么东西可吃。想买点吃的,可又不知道买什么吃比较好。 今天...
    Eunice小锦阅读 1,501评论 0 2