240 发简信
IP属地:北京
  • spark基础

    hadoop生态圈:分布式存储-hdfs;分布式批处理-mapreduce 将大量数据进行处理,获取我们需要的有价值的信息 弊端:频繁的写磁盘;...

  • Embedding+抽取式摘要

    1)对于某个文档进行分句 2)对于每个分句使用Word2Vec等工具进行向量化(Word Embedding), 3)将句子中的每个词或词组的W...

个人介绍
自然语言处理、机器学习