c3ea6eadfb7e - 简书

发简信

c3ea6eadfb7e

26
关注
0
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：北京

atLee

利用Python实现wiki中文语料的word2vec模型构建
本实例主要介绍的是选取wiki中文语料，并使用python完成Word2vec模型构建的实践过程，不包含原理部分，旨在一步一步的了解自然语言处理的基本方法和步骤。文章主要包含...

33057 35 44 1
张照博

【知识图谱】RDF理解以及Neo4j初次尝试
正文之前上上周，终于被我们实验室的一个小老板收编了。后续应该就是安安静静的当一个搞研究的博士新人了。。暂定方向可能是下面三个：知识图谱自然语言处理图数据库加入了课题组的...

13723 16 26 2
面面的徐爷

Scale和Normalization的异同
前言在处理数据的时候，经常会遇到两个名词Scale和Normalization，这两个名词经常会被混杂着使用，让我在理解一些操作的时候经常会迷糊，那么我就结合R语言里面的s...

5384 1 13
Quasars

[DP] 2种编辑距离（Damerau/Levenshtein Distance）
做完这题觉得必须得来个解题报告了，这题的动态规划有点酸爽啊～问题如下： L氏距离(Levenshtein Distance) 基础的编辑距离只有3种原子操作：插入1个字符，...

7774 0 2
山阴少年

NLP入门（四）命名实体识别（NER）
本文将会简单介绍自然语言处理（NLP）中的命名实体识别（NER）。命名实体识别（Named Entity Recognition，简称NER）是信息提取、问答系统、句...

73180 6 19
Wonshington

BoW（Bag of words）模型详解
最近在研究自然场景图像和结构图像的分类时，碰巧遇到词袋模型，就顺便对其进行了学习。下文算是本人学习后的一点总结吧。 Bag of words模型最初被用在文本分类中，将文档表...

17084 0 12
妄心xyx

Python如何计算编辑距离？
算法原理在计算文本的相似性时，经常会用到编辑距离。编辑距离，又称Levenshtein距离，是指两个字串之间，由一个转成另一个所需的最少编辑操作次数。通常来说，编辑距离越小...

21139 0 16
机器学习算法工程师

15分钟入门NLP神器—Gensim
前言作为自然语言处理爱好者，大家都应该听说过或使用过大名鼎鼎的Gensim吧，这是一款具备多种功能的神器。Gensim是一款开源的第三方Python工具包，用于从原始的...

58258 0 22