什么是条件随机场 CRF: Conditional Random Fields

Conditional Random Fields 条件随机场,是一种判别模型,可以用于预测序列数据,通过使用过去的上下文信息,使模型达到更好的预测效果。

定义:

CRF 是一个无向图模型,它的节点可以分为两个不相交的集合 观测集 X,输出集 Y,然后可以对 P(Y|X)进行建模。


判别模型 vs 生成模型:

判别模型:由数据直接学习决策函数 Y=f(X) 或者条件概率分布 P(Y|X),作为预测值。例如 k近邻,感知级,决策树,支持向量机等。

生成模型:先由数据学习联合概率密度分布 P(X,Y),然后求出条件概率分布 P(Y|X),作为预测值。例如朴素贝叶斯,隐马尔科夫模型等。


CRF 的应用:

CRF 可以对序列数据建模,所以在 NLP 领域有很多应用。例如 :

Parts-of-Speech tagging,这个任务依赖之前的单词,通过使用 feature functions ,可以用 CRF 来判别哪些单词对应哪个 POS。

Named Entity recognition,CRF 可用于预测多变量相互依赖的序列。

还可用于图片的 parts-recognition,基因预测等任务.


HMM 和 CRF 看起来很像:

它们的区别是:

  • HMM 是有向图,CRF 是无向图;
  • HMM 计算的是状态和观测的联合概率,而 CRF 计算的是状态基于观测的条件概率。
  • HMM 多用于那种状态“原生”,观测是状态“生成”出来的场景。如,用 HMM 来生成一段语音,则状态对应的是音节(声韵母)或文字,而观测则是这个音节所对应的声学特征。
  • CRF 则多用于那种观测“原生”。状态“后天”产生,用来标记观测的情况。如,用 CRF 来做文本实体标记。输入一句话“我有一个苹果”,CRF 处理后将“苹果”标记成了“水果”。这个时候,“苹果”是观测,而“水果”则是对应的状态。

学习资料:
https://en.wikipedia.org/wiki/Conditional_random_field
https://medium.com/ml2vec/overview-of-conditional-random-fields-68a2a20fa541
https://blog.csdn.net/zouxy09/article/details/8195017

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 层次化的隐马尔可夫模型 在自然语言处理等应用中,由于处理序列具有递归特性,尤其当序列长度比较大时,HMM的复杂度将...
    我偏笑_NSNirvana阅读 6,807评论 1 15
  • 条件随机场就像HMM一样,最开始让我难以理解,但其实认真看了,也不是太难。本文总结自这边博客,它的引用的资料值得一...
    放开那个BUG阅读 3,560评论 0 1
  • 《Deep work》 本书是由一位计算机科学博士卡尔 纽波特撰写,重点创立了“深度工作”的概念,并且从神经学、心...
    爱吃鳗鱼的MR阅读 259评论 0 0
  • 吃饭,也是一种修行 01 上个月,我在家自行辟谷七天。前三天,吃了少许水果。最后基本是清水辟谷了。 一下子让工作了...
    花雨满天的世界阅读 501评论 0 0
  • 图/文:大脚板老师 6-8日,我们的教室变高考考场,我们的学生将桌椅搬到体育馆,继续复习备战。 有那么二三事,在平...
    大脚板老师阅读 1,629评论 1 5