NLP技术全景图(内含思维导图)

思维导图如下,如有需求联系作者(免费发送!!)


自然语言处理.png

词法分析

分词

  • 中文分词

    • 字典树

      • 二分搜索查找树

        • 首字哈希
      • 双数组字典树

        • 基于DAT的AC自动机
    • 扫描规则

      • 正向最长
      • 逆向最长
      • 双向最长
    • n元语法

      • 最短路径
      • N最短路径
    • 序列标注

  • 英文分词

    • 空格切分
    • 有限状态自动机
    • byte pair encoding

词干提取

  • 波特词干算法

词性还原

  • 基于词典

词性标注

  • Meta-BiLSTM
  • Flair

命名实体识别

  • 有限状态自动机

  • 序列标注

    • 角色标注

    • IOBES标注

      • Bert
      • Flair
      • ELMo
      • CVT

句法分析

依存句法分析

  • 基于图

    • Eisner算法
    • 最大生成树
    • Chu-Liu-Edmonds算法
    • BiAffine算法
  • 基于转移

    • 转移系统

      • Arc-Standard
      • Arc-Eager
      • Arc-Swift
      • list-based Arc-Eager
      • Pseudo-Projective Parsing
      • Online Reordering
    • 学习策略

      • 静态规范
      • 动态规范

语义分析

词义消歧

  • 监督学习

    • 传统方法

      • 互信息
      • 贝叶斯模型
      • 最大熵模型
    • 深度学习

      • Attention+BiLSTM
      • ELMo
  • 无监督学习

    • Shotgun WSD
    • MCS Estimation
  • 基于知识

    • 基于词典
    • Yarowsky算法

语义角色标注

  • 传统方法

    • 基于短语结构树
    • 基于依存句法树
    • 基于语块
  • 深度学习

    • ELMo
    • 联合学习谓词与论元

语义依存分析

  • 基于图

    • BiAffine+Bert
  • 基于转移

    • list-based Arc-Eager+Tree RNN

抽象语义表示

  • Sequence-to-Graph Transducer

  • 基于机器翻译

  • 基于转移

    • AMREager
    • CAMR
  • 基于图

    • JAMR

自然语言转SQL

  • Seq2Seq
  • 语义分析器

文本聚类

  • 聚类算法
  • 特征提取

文本分类

传统方法

  • 分词

  • 停用词过滤

  • 特征选择

    • 卡方检验
    • 互信息
  • 词袋向量

  • 浅层学习

    • NB朴素贝叶斯
    • SVM支持向量机
    • KNN K近邻
    • DT决策树
    • RF随机森林

深度学习

  • Recursive Neural Network 递归神经网络
  • Graph Neural Network 图神经网络
  • Fasttext
  • XLNet
  • Bert
  • ULMFiT

情感分析

文本摘要

抽取式

  • 无监督学习

    • TextRank
    • LexRank
    • TF-IDF
  • 监督学习

    • 二分类模型

    • 序列标注模型

    • 回归排序模型

    • 深度学习

      • RNEs
      • SWAP-NET
      • Latent
      • HeterSumGraph

生成式

  • Seq2Seq+Attention
  • 指针网络(Pointer-Generator Network)
  • Attention-Based Summarization
  • 生成对抗网络(GAN)
  • 关键信息指导网络(KIGN)
  • 深度沟通代理(DCA)

主题模型

LSA

  • 奇异值分解

LDA

  • 马尔科夫链
  • 吉布斯采样

自动编码器

受限玻尔兹曼机

语音识别

传统方法

  • 傅里叶变换
  • 倒谱均值归一化
  • 声道长度归一化
  • 声学模型
  • 发音模型
  • 隐马尔可夫模型
  • n元语法

深度学习

  • ContextNet
  • 连接时序分类(connectionist temporal classification)
  • LSTM-HMM
  • 神经网络语言模型

内容推荐

协同过滤

  • 欧氏距离
  • 余弦距离
  • Tanimoto 系数

深度学习

  • RBM
  • AE
  • CNN
  • RNN
  • DSSM

基于知识

  • 基于路径

    • HeteroMF
    • Hete-MF
  • 基于嵌入

    • Node2vec
    • entity2vec
    • DKN
    • RKGE
  • 基于混合

    • RippleNet
    • KGCN
    • KGAT

常识推理

Bert

XLNet

指代消解

类型

  • 共指
  • 回指
  • 所指

规则系统

  • 朴素Hobbs

统计方法

  • Mention-Pair
  • Mention-Ranking
  • Entity-Mention

人机对话

对话行为分类

  • CRF-ASN
  • BiLSTM-CRF

对话状态跟踪

  • Delexicalised RNN
  • Neural Belief Tracker(NBT)
  • 全局-局部自注意力(GLAD)
  • Fully NBT

检索式回复机器人

  • Poly Encoder
  • Bert
  • ELMO

生成式回复机器人

  • TransferTransfo
  • XNLG
  • Seq2Seq

意图识别

  • classification模型
  • match模型

槽位填充

  • Seq2Seq+Attention
  • Event Schema Induction

语法纠错

Copy机制

  • spellingcheck+transformer
  • Copy-Augmented Transformer
  • Confusionset guided Pointer Networks

MASK机制

  • Transformer
  • FASPell
  • Soft-Masked BERT
  • SpellGCN

关系预测

张量分解

  • RESCAL

图神经网络

  • RGCN
  • KBAT

表示学习

  • TransE
  • TransH
  • ConvE
  • ConvKB

实体链接

实体消歧模型

  • DeepType
  • ELDEN
  • DeepCosine

联合抽取模型

  • end-to-end EL
  • Stack-LSTM
  • CDTE
  • WAT

机器问答

基于知识

  • Gated Graph Neural Networks
  • Bidirectional Attentive Memory Networks
  • KemQA

基于检索

  • Denoising QA
  • DecaProp

完形填空

  • Attentive Reader
  • Standford Reader
  • Match-LSTM
  • AoA Reader
  • CoVe + DCN
  • QANet
  • Hierarchical Attention Flow
  • GPT

信息抽取

名词短语规范化

  • CESI

三元组抽取

  • SPO定义

    • 主体subject
    • 客体object
    • 关系predicate
  • Bert

    • R-Bert
    • Muti-Attention CNN
  • CNN

    • CR-CNN
    • GCN
  • RNN

    • Entity Attention Bi-LSTM
    • Hierarchical Attention Bi-LSTM
  • 依存句法分析(dependency parsing)

    • BRCNN
    • SDP-LSTM
    • DepNN

语言模型

统计语言模型

  • N-gram
  • Pitman-yor过程

神经语言模型

  • 神经网络语言模型(NNLM)
  • RNN 语言模型(RNNLM)
  • 双向语言模型(BiLM)
  • AWD-LSTM
  • Transformer-XL
  • Gated CNN
  • 预训练语言模型

词汇规范化

  • MoNoise
  • Joint POS + Norm in a Viterbi decoding
  • Syllable based
  • unLOL

自然语言推理

注意力机制

  • BiLSTM-Attention
  • 深度递归卷积网络(DRCN)
  • Transformer

记忆增强

  • 记忆网络(MemNN)
  • 循环实体网络(ENTNET)
  • 快速响应网络(Quick Response Network)
  • 可微分神经计算机(DNC)
  • 神经过程网络(NPN)

机器翻译

规则机器翻译

统计机器翻译

  • IBM1
  • IBM2
  • IBM3
  • IBM4
  • 语言模型

神经机器翻译

  • Seq2Seq

    • RNN
    • LSTM
    • GRU
    • ConvS2S
  • Transformer

文本语义相似度

距离度量

  • Levenshtein最小编辑距离
  • Jaccard杰卡德相似度
  • Cos余弦相似度

文本表示

  • 特征建模

    • TF-IDF
    • BM25
    • SimHash
    • LSA
    • LDA
  • 深层语义

    • Gensen
    • XLNet
    • 双塔模型(Siamese Network)
  • 复杂交互

    • MatchPyramid
    • ESIM(Enhancing Sequential Inference Model)
    • BiMPM(Bilateral multi-perspective matching model)
    • MWAN(Multiway Attention Networks)

词嵌入Embedding

语境相关/动态

  • ELMO
  • Flair
  • Bert
  • XLNet

语境无关/静态

  • Word2vec
  • Glove
  • Fasttext

知识图谱Knowledge Graph

机器学习

监督学习

  • 隐马尔可夫模型

  • 最大熵模型

  • 条件随机场

  • 结构化感知机

  • 感知机

  • 逻辑回归

  • 朴素贝叶斯法

  • K近邻

  • 决策树

  • 支持向量机

  • 神经网络

    • 网络模块

      • 全连接神经网络

      • 卷积神经网络

        • 池化层
        • 卷积层
      • 循环神经网络

        • RNN
        • GRU
        • LSTM
        • Stacked LSTM
        • Highway Connection
      • 递归神经网络

        • Tree-RNN
        • Syntactically-United RNN
        • Matrix-Vector RNN
      • 注意力神经网络

        • Soft Attention
        • Multi-Head Attention
        • Hierarchical Attention Model
        • Transformer
      • 图神经网络

        • GNN
        • GCN
        • GAT
    • 激活函数

      • Softmax
      • elu
      • selu
      • softplus
      • softsign
      • relu
      • tanh
      • sigmoid
    • 初始化

      • 正态分布
      • 均匀分布
      • 常数初始化
      • 正交初始化
    • 优化器

      • SGD
      • RMSprop
      • Adagrad
      • Adadelta
      • Adam
      • Adamax
      • Nadam
    • 训练策略

      • dropout
      • word dropout
      • variational dropout
      • 正则化
      • 对抗训练

无监督学习

  • 聚类分析

    • 估计聚类数量

      • gap statistic
      • 平方误差和
      • 轮廓系数
    • 聚类算法

      • K Means
      • 重复二分法
      • DBSCAN
      • 层次聚类法HAC
  • 概率密度估计

    • 异常检测
    • 对抗神经网络
    • 自动编码器
    • 受限玻尔兹曼机
  • 可视化

    • PCA
    • t-SNE

半/自监督学习

  • Self-Training

    • LM

      • ELMo
      • GPT
      • UNiLM
    • MLM

      • Bert
      • SpanBert
      • XLM
      • MASS
      • T5
    • PLM

      • XLNet
    • 去噪自编码器DAE

      • Bart
    • 对比学习CTL

      • RTD

        • CBOW-NS
        • ELECTRA
      • NSP

        • Bert
        • UNiLM
      • SOP

        • ALBert
        • StructBert
    • 知识增强

      • 向量融合

        • ERNIE
        • KnowBert
        • Bert-MK
      • 知识监督

        • WKLM
        • LIBert
        • GLM
      • 结构统一

        • K-Bert
        • CoLAKE
      • 联合训练

        • KEPLER
        • K-ADAPTER
      • 知识检索

        • FaE
        • REALM
  • Co-Training

  • 半监督SVM

  • 生成式模型

  • 图半监督学习

  • 主动学习

强化学习

  • Model-free

    • Q learning
    • Sarsa
    • Policy Gradients
  • model-based

    • Model-Based Policy Optimization
    • MB-MPO
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342