11
0
2
1055
hadoop生态圈:分布式存储-hdfs;分布式批处理-mapreduce 将大量数据进行处理,获取我们需要的有价值的信息 弊端:频繁的写磁盘;...
1)对于某个文档进行分句 2)对于每个分句使用Word2Vec等工具进行向量化(Word Embedding), 3)将句子中的每个词或词组的W...