数据挖掘概率基础

1)随机现象

根据客观现象的特征,将其分类两类:一类是确定性现象,在一定条件下必然出现(或不出现)某种结果的现象;另一类是随机现象,在给定的条件下不能确切预言其结果的现象,可在相同条件下重复进行观察或试验,而每次观察或试验的结果不止一个,且事先无法预知确切的结果。在不确定的现象中,还有一种无法重复观察或试验的情况,如无法确定2050年会不会爆发世界大战,这种一次性不可重复的现象称为不确定现象。

概率研究的对象是随机现象。虽然随机现象每次的结果具有偶然性,但在大量观察或多次重复试验后其结果常常会呈现出某种规律性。

2)随机事件

对随机现象进行观测也称作随机试验。随机试验的每一种结果或随机现象的每一种表现都称作随机事件,一般用大写字母A、B、C,….表示。

基本事件:不能再被分解为两个或两个以上的事件。基本事件是随机试验的最基本结果,每次试验必出现一个基本事件,任何两个基本事件都不会同时出现。

复合事件:由两个或两个以上基本事件所组成的事件。

一项随机试验的所有基本事件的集合,称作该随机试验的基本事件空间。必然事件是每次试验都一定出现的事件,记作Ω。任何一次试验都不可能出现的事件称为不可能事件,记作Φ。

事件的关系有包含和相等,事件的运算有和(并)、差、交(积)、逆。

包含:关系式A⊂B表示若A出现则B也出现,反之则未必;

相等:关系A=B表示事件A和B同时出现或都不出现;

和(并):运算式A+B或A∪B表示A和B中至少出现一个;

差:运算式A-B或A\B表示事件A出现但B不出现;

交(积):运算式A∩B表示事件A和B同时出现;

逆事件: 表示A不出现,是A的对立事件;

不相容:若AB=Φ,则A与B不可能同时出现,称A和B不相容。

3)概率概念和性质

对于一个随机事件来说,它在一次试验中可能发生,也可能不发生。既然有可能性,就有可能性大小的问题。事件A在随机试验中出现可能性大小的数值度量,称做概率。事件A的概率以P(A)表示。

在相同条件下,重复进行同一随机试验,A是这个试验的一个结果(事件)。设试验次数为n,在n次重复试验中A出现的次数为nA,则事件A的频率为:nA/n=Pn(A)。当试验次数n较小时,频率的数值有较大的波动,但n充分大时,频率数值的波动明显减弱,并且随着n的增长,频率会趋于稳定在某个常数p附近。

随机试验的频率具有随试验次数增加而趋向稳定的性质,而频率的稳定值可以用来反映事件发生的可能性大小。因此,可以说频率的稳定值p是事件A发生的概率, 即P(A)=p。要注意区别频率和概率,虽然二者都是事件出现可能性大小的度量,但频率是试验值,依赖于试验的次数,即使试验次数相同,频率也可能取值不同,频率具有随机性;而概率则是独立于试验而客观存在的理论值,其大小取决于事件本身固有的规律性。当然在实际应用中,常常通过大量重复试验得到事件发生的频率,且以它作为概率的近似值或估计值。频率是试验值,随机的;概率是理论值,规律的。

设事件A的概率为P(A),则具有如下性质:

非负性,即0≤P(A)≤1;

规范性,对于必然事件Ω,有P(Ω)=1;

对于随机事件Ai(i=1,2,…),只要它们两两互不相容,则有: 

4)概率的估计和计算

概率的直接计算有两种场合:古典型概率和几何型概率,古典型概率用事件个数比率计算,而几何型概率则是用几何度量比率。

也可以用频率直接估计概率。

也可以使主观概率,如专家估计。

概率的计算公式:

概率的加法法则:任意两个事件P(A+B)=P(A)+P(B)-P(AB),不相容事件P(A+B) =P(A)+P(B)。

条件概率:P(A|B)=P(AB)/P(B),在事件B发生的条件下,事件A发生的条件概率。

概率的乘法公式:P(AB)=P(B)P(A|B)=P(A)P(B|A)。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容

  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 8,983评论 0 13
  • 你的数学直觉怎么样?你能凭借直觉,迅速地判断出谁的概率大,谁的概率小吗?下面就是 26 个这样的问题。如果你感兴趣...
    cnnjzc阅读 6,874评论 0 12
  • 1. 关于诊断X线机准直器的作用,错误的是()。 (6.0 分) A. 显示照射野 B. 显示中心线 C. 屏蔽多...
    我们村我最帅阅读 10,350评论 0 5
  • 胃有毛病的患者都体验过做胃镜是一个非常痛苦的过程,爱翰公司最近开发的一款磁控胶囊胃镜就为胃病患者带来了福音,这款创...
    泥巴创客空间_f6db阅读 305评论 0 0
  • 一直以来,一直学不会做鱼,尤其是学不会老妈做鱼的技巧,作为一个资深吃货,感觉很受伤,连鱼都不会做,我还好意思自称是...
    小李非刀阅读 775评论 9 7