a95e2701dc12 - 简书

发简信

0
关注
1
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：浙江

a95e2701dc12

请问作者一共提取了多少文章？为什么直接解压有69G的文本，用gensim的wikicorpus提取出来只有400多万的文章？我也遇到了这个问题

英文维基百科语料上的Word2Vec实验
做word2vec实验主要是论文需要用到词向量，至于word2vec内在的数学原理啥的真的一窍不通，为了处理维基百科的语料，光是安装gensim的准备工作都搞了好久，后来发现...

freedomzll
5038 1 0
a95e2701dc12

暂无个人介绍