![Avatar notebook default](https://cdn2.jianshu.io/assets/default_avatar/avatar-notebook-default-640f7dde88592bdf6417d8ce1902636e.png)
9篇文章 · 20867字 · 3人关注
本系列的前两篇是:自然语言处理实战(一),地址:https://www.jianshu.com/p/cf14318db049自然语言处理实战(二...
自然语言处理实战(一),地址:https://www.jianshu.com/p/cf14318db049自然语言处理实战(三),地址:http...
一种新的文本表示方法——基于搜狗新闻数据的分类研究 本文记录作者的研究成果和无敌详细的实验过程,干货满满!本文是完全原创,首发于简书,转载请私信...
该图通过《python数据分析与挖掘实战》这一本书整理,转载请注明出处!
Introduction 一方面目前文本分类技术主要考虑词或词的组合;另一方面,研究表明,卷积神经网络在从原始信号中抽取信息的方面,非常有用。在...
独热编码 独热编码即 One-Hot 编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且...
背景 我们的目的是要用数学量来表示物理量,可是标量加上向量,都不足以表达所有的物理量,所以就需要扩大数学量的概念,张量就出现了。 概念 几何代数...
定义 在信息检索中,tf-idf(词频-逆文档频率)是一种统计方法,用以评估一个单词在一个文档集合或语料库中的重要程度。经常被用作信息检索、文本...
简单介绍 LSA和传统向量空间模型(vector space model)一样使用向量来表示词(terms)和文档(documents),并通过...
文集作者