1.贝叶斯定理

一、概念   

  在开始讲贝叶斯定理前,先对概率论的几个定理有所了解,那就是:随机变量、联合分布、边缘分布和条件分布。

随机变量X:

       概率论中的随机变量不同于往常提到的变量,一般用大写的X表示。在概率论中,可以把随机变量X当作一种函数,那么简单的理解函数的作用就是映射了。在这个随机变量函数中,其定义域可认为是实验的结果,值域根据人为而设定。

     举个例子,在某次投掷骰子的实验中,骰子为六面体(1、2、3、4、5、6),那么其结果就为这六个值中的某个值,我们可认为这些值就是随机变量函数的定义域。现在建立一个映射关系,假如取 y=x,那么随机变量X的结果为5(假设这次投掷的结果为5)。假设映射关系为取实验结果值得偶数,那么X就为0或者1.

     随机变量X 取值为a的概率 一般表示为P(X=a)或者P X(a),或者X取值小于或等于a的概率:P(X<=a).


联合分布:

     随机变量的分布是指X取某些值的概率,因此可以把分布理解为概率!!!(往后中会有很多地方提到),使用P(X)表示随机变量X的分布。

     联合分布是指多于一个变量的分布,此时的概率是由所有的变量共同决定的。这里要区分一点:P(X=a,Y=b)表示的是X取a、Y取b时的概率,而P(X,Y)表示X、Y的联合分布。

     举个两个随机变量决定的联合分布栗子~:  还是以投掷6面骰子为例,随机变量X的映射关系取y=x,也就是直接把实验结果的值作为随机变量的结果X=1、2、3、4、5、6.  而Y为投掷一枚硬币的随机变量,取值为0和1:,两者的联合分布为:

       这个表第一个1/12可表示为:在X=1的情况下,Y=0 的概率为1/12.

边缘分布:

      边缘分布是通过联合分布定义的。给点随机变量X和Y的联合分布P(X,Y),可以定义X或者Y的边缘分布,指的是某个随机变量自身的概率分布。随机变量的边缘分布通过将联合分布中的其他随机变量相加而得到:

      其中,val(Y)表示随机变量Y的取值范围。


条件分布:

   条件分布指出了在当其他随机变量已知的情况下某个特定随机变量的分布。例如:随机变量X在随机变量Y=b的情况下取值为a的条件概率(条件分布)可以定义为:

    基于贝叶斯定理,P(X=a| Y=b)可写为:

�    这个往后会提到,这里先放着哈哈。~~~。当然,对于更多随机变量的联合分布的情况下,求某一个条件分布也是同理:

讲完了上述的概念,先来道题目练练~~(这是从百度知道上找来的):


解:用独立性及边缘分布与联合分布的关系计算.




二、贝叶斯定理

       Bayes定理在机器学习中应用很多。我第一次接触该定理应该是今年2月份,在推导深度信念神经网络(DBN)时看到的,当时也是一知半解,什么能量函数,先验概率,归一化因子等等,后来查了查资料,发现里面的内容还真多。。。。不得不提的是朴素贝叶斯算法和EM算法曾入选“数据挖掘十大算法”,很难想象贝叶斯是一位传教士。

       回归正题,贝叶斯定理无非就是一个条件概率公式:


        其中,P(A)称为先验(piror)概率; P(B|A)是随机变量B相对于A的条件(class-conditional probability)概率,或者称为似然(likelihood)概率; P(B)叫做归一化因子; P(A|B)叫做后验概率。


举例1:饼干问题

       假设现在有两碗饼干,碗1中有30个曲奇和10个巧克力,碗2中有20个曲奇和20个巧克力,如果现在随机从其中一个碗中随机抽取一个饼干,发现抽到的是曲奇,请问该曲奇来自碗1的概率是多少?用公式来描述此问题的话,就是求P(碗1|曲奇)的数值是多少.那么根据贝叶斯公式,我们知道P(碗1|曲奇)=P(曲奇|碗1)*P(碗1)/P(曲奇),根据题设,P(曲奇|碗1)=30/50=3/4,P(碗1)=1/2,P(曲奇)=(20+30)/80=5/8,因此P(碗1|曲奇)=3/4 * 1/2 / 5/8 = 3/5,这样我们就成功地运用了贝叶斯方法解决了这个问题.

举例2:MontyHall问题(转移概率,HMM中用到)

       假设有三个门,每个门后面都有一个奖品,其中一个奖品是一辆车,另外两个奖品是很没有价值的东西.奖品是由Monty随机布置的,游戏的规则是谁抽中了车子的那个门,谁就可以拥有车.现在你选择了门1,另外两个门分别记做2和3,在你打开门之前,Monty打开了2和3中的其中一扇门3,并且袒露了那扇门后面并没有车子,请问你现在是否要更换注意?或者还是坚持门1.即求出此时坚持1门或者更换的概率分别是多少.这里我们依然可以选择使用贝叶斯分析方法来分析这个问题.

我们用D1 D2 D3分别代表Monty打开1 2 3门的事件,用C1 C2 C3分别代表车子在1 2 3门后面的事件,我们知道Monty打开2个门的先验概率都是1/2.即P(D2)=P(D3)=1/2;现在假设车子在1门后面,则Monty打开3门的概率是P(D3|C1)=1/2,由于Monty永远都不会打开那扇藏有车子的门,因此假如车子藏在3门后面则Monty打开3门的概率为0,即P(D3|C3)=0;最后,如果车子藏在2门后面,则Monty打开3门的概率为1,即P(D3|C2)=1;因此,我们计算出P(C1|D3)=P(C1)*P(D3|C1)/P(D3)=1/3 * 1/2 / 1/2 = 1/3;P(C2|D3) = P(C2) * P(D3|C2) / P(D3) = 1/3 * 1 / 1/2 = 2/3; 因此,更换决策的话,概率为2/3.



参考文献:

1.机器学习预备知识之概率论(上)

2.说说重要的贝叶斯公式吧


~~~,大家仔细看的话发现很多都不是原创的(真是尴尬),哈哈,欢迎大家拍砖

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容