范文一:贝叶斯公式的应用论文
-
本科生学年论文
论文题目 贝叶斯公式的应用 学生姓名 李红荣 学生学号 200990014057 专业名称 数学与应用数学 指导教师 窦晓霞
数 学 系
2011年12月28日
.
-
摘要:本文主要通过举例说明了贝叶斯公式在医学,经济方面的应用,概述了贝叶斯方法的实用性。
关键字:贝叶斯公式,先验概率,后验概率
引言:贝叶斯公式在疾病诊断及经济决策方面都有广泛的应用。我们常常喜欢找“有经验”的医生给自己治病,因为过去的“经验”能帮助医生做出比较准确的诊断。几乎任何一项经济学的研究、决策都离不开概率统计的应用,概率统计是进行经济学问题研究的有效工具,为经济预测和决策提供了新的手段,特别在信息不完全的情况下应用贝叶斯公式更是十分有效的。
一,贝叶斯公式
若事件,,?,是样本空间,的一个划分,>0(i=1,2,?,n),A是BBPB()B2ni1
任一事件且>0,则有: PA()
PBPAB()(),jj= (j=1,2,?,n), (1) PB()AjPA()
其中,可由全概率公式得到,即 PA()
n
=PBPAB()(), (2) PA(),ii,1i
本文主要应用贝叶斯公式的一种简单情形,即对任意两个事件A和B,根据贝叶斯公式有
PBPAB()(),PBA(),, (3)
PA()
其中
PAPBPABPPA()()()()(),,,,BB (4)
这里,事件B的概率通常是根据以往数据分析得到,叫做先验概率,而PBA(),是在获得新的信息后对先验概率做出重新认识,称为后验概率。后验概率体现了已有信息带来的知识更新,经常用来分析事件发生的原因。
二,贝叶斯公式的应用
.
-
1,疾病诊断
用甲胎蛋白法普查肝癌。令C={被检验者患肝癌},A={甲白检验结果为阳
A性}则,={被检验者未患肝癌},={甲胎蛋白检验结果为阴性},由过去的资C
料已知=0.95,=0.90,又已知某地居民的肝癌发病率为PAC(),P()AC,
P(C)=0.0004.在普查中查出一批甲胎蛋白检验结果未、为阳性的人,求这批人中真的患有肝癌的概率. PC(),A
PCPAC()(),由贝叶斯公式可得.= PC(),A
PCPACPCPAC()()()(),,,
0.00040.95,==0.0038 0.00040.950.99960.1,,,
由此可知,经甲胎蛋白法检验阳性的人群中,其中真正患有肝癌的人还是很少的。把.=0.0038和已知的=0.95,=0.90对比一下是很有PC(),AP()AC,PAC(),
意思的。当已知病人患肝癌或未患肝癌时,甲胎蛋白检验的准确性应该说是比较高的,这从=0.95和=0.90可以肯定这一点。但如果未知病人是否PAC(),P()AC,
患肝癌,而要从甲胎蛋白检验结果为阳性这一事件出发,来判断病人是否患肝癌,那么它的准确性还是很低的,因为只有0.0038。这个事实看来似乎有点PC(),A
矛盾,一种检验方法“准确性”很高,在实际使用时准确性却又很低,到底是怎么一回事呢,这从上述计算中用到的贝叶斯公式可以得到解释。已知
是不大的(这时被检验者未患肝癌,但甲胎蛋白检验结果为阳性,PAC()0.1,,
即检验结果是错误的),但是患肝癌的人毕竟很少(在本例中为P(C)=0.0004),于是未患肝癌的人占了绝大多数(),这就使得检验结果是错误的PC()0.9996,
部分相对很大。从而造成很小。那么,上述结果是不是说明PCPAC()(),PC(),A
甲胎蛋白法不能用了呢,完全不是:通常医生总是先采取一些其他简单易行的辅助方法进行检查,当他怀疑某个对象有可能患肝癌时,才建议用甲胎蛋白法检验。这时在被怀疑的对象中,肝癌的发病率已经显著的增加了。比方说,在被怀疑的对象中P(C)=0.5,这时按上述方法计算可以得到=0.5,这时按上述PC(),A
方法计算可得到=0.90,这就有相当高的准确性了。由此读者可以想到,PC(),A
.
-
对一些疑难病症,医生为什么要用几种不同的方法进行检查了。
下面再举一个心理学研究中常被引用的例子:参加常规检查的40岁妇女患乳腺癌的概率是1,.如果一个妇女患有乳腺癌,则她有80,的概率将接受早期的胸部肿瘤X射线检查,如果一个妇女没有患乳腺癌,也有9.6,的概率将接受早期的胸部肿瘤X射线检查.在这一年龄群的常规检查中某一妇女接受了早期的胸部肿瘤X射线检查,问她实际患乳腺癌的概率是多少,
心理学家关心的是,一个不懂得贝叶斯原理的人对上述问题进行直觉推理时的情形是什么样的,并将他们的判断结果与贝叶斯公式计算的结果作比较来研究推理过程的规律。结果,95,的内科医生的判断介于70,——80,,远远偏离正确答案。设B={患有乳腺癌},A={早期胸部肿瘤X射线检查}。由资料知P(B)=0.01,=0.99,=0.8,=0.096,由上面公式(4)有PB()PA(),,PAB(),
=0.01×0.8+0.99×0.096=0.10304 ,利用上面PAPBPABPBPAB()()()()(),,,,
0.0010.8,PBPAB()(),公式(3)有==0.0776.由此可知,在这一年龄群PBA(),,0.10304PA()
的常规检查中某妇女接受了早期胸部肿瘤X射线检查,她实际患乳腺癌的概率是0.0776.
2,经济方面的应用
(1)生产管理是现代企业管理的重要一环,但是在生产管路过程中很多企业根据主观判断进行,难以准确度量,利用贝叶斯公式可以很好地解决这一问题。
假设某厂有4个车间生产同一件产品,其产量占总产量的比例分别为0.15,0.2,0.3,和0.35,各车间的次品率分别为0.05,0,04,0.03和0.02.有一用户买了该厂的产品,其中1件产品是次品,对该用户造成了重大损失,用户按规定进行了索赔。厂长要追究生产车间的责任,但是该产品是哪个车间生产的标志已经脱落,问厂长应如何追究生产车间的责任,
由于不知该产品是由哪个车间生产的,因此每个车间都要负责任,各个车间所负责人的大小应该与该产品由各个车间生产的概率成正比。设={该产品是Ai
ii由第个车间生产的},(=1,2,3,4),B={从该厂的产品中任取1件恰好取到次
i品},则第个车间所负责的大小为条件概率,由贝叶斯公式得PAB(),i
.
-
PAPBA()(),ii,又因PAB(),,in
PAPBA()(),,ii,1i
P.()0.058,()0.04,()0,,,,,,,,BAPBAPBAPBA03,()0.02,1234
从而PAPAPAPA()0.15,()0.2,()0.3,,,,,()0.35,1234
PAPBA()(),11=0.238,PAB(),,1n
PAPBA()(),,ii,i1
PAPBA()(),PAPBA()(),2244=0.254PAB(),,,()0.222PAB,,,24nn
PAPBA()(),PAPBA()(),,,iiii,,i1i1
PAPBA()(),33即第1,第2,第3,第4车间所负责的百分比,()0.286PAB,,,3n
PAPBA()(),,ii,i1
分别为0.238,0.254,0.286,0.222,由此可见,第3车间所负责最大。
根据后验概率进行判断,对追究责任和索取赔偿具有一定的理论依据。 (2)我们知道营销的成功与信誉度有很大的关系,下面利用贝叶斯公式考察,如果一家公司多次不讲究信誉度会有怎么样的结果。
假设一家公司的可信度是0.8,不可信度为0.2,问该公司多次失信后客户对其相信度变为多少,
现在用贝叶斯公式来分析此问题中的可信度是如何下降的。
首先记事件A={不可信},B={可信},不妨设客户过去对该公司的印象为
(5) PBPB()0.8,()0.2,,
用贝叶斯公式来求,亦即该公司失信一次后,客户对其可信程度改PBA(),
变。在贝叶斯公式中我们要用到概率和,不妨设PAB(),PAB(),
,第一次客户相信该公司,发现该公司不可信时,客户PABPAB()0.1,()0.5,,,,
根据这个信息对这家公司的可信程度改变为
PBPAB()()0.80.1,,,PB()0.444,,,, 0.80.10.20.5,,,PBPABPBPAB()()()(),,,
.
-
这表明客户上了一次当后,对这家公司的可信度有原来的0.8调整为0.444,也就是(5)是调整为。在此基础上,我们对这家公司PBPB()0.444,()0.556,,
的可信度再一次用贝叶斯公式来计算,亦即该公司第二次不诚信后,客PB(),,
户对他的可信程度改变为
PBPAB()()0.4440.1,,,。 PB()0.138,,,,0.4440.10.5560.5,,,PBPABPBPAB()()()(),,,
这表明客户经过再次上当,对这家公司的可信程度已经从0.8下降到0.138,如此低的可信度,该公司如何奢望对客户进行第三次营销的时候会成功,顾客怎么会相信、怎么会愿意购买呢,进而必然严重影响公司营销的业绩。 3.在风险决策中的应用
某厂商要确定下一计划期内产品的生产批量,有三种方案可供选择,即大批量生产(A),中批量生产(B),小批量生产(C).市场的销路状态有三种:销路好(),销路一般(),销路差(),根据以前的资料,销路状态分布为xxx123
P()=0.3,P()=0.5,P()=0.2,三种方案在不同需求状态下的收益如下表xxx123
所示:
生产批量方案数据表 (单位:万元)
销路状态 各状态概率 收益(行动方案(CP))
A B C
0.3 70 40 15 x1
0.5 30 25 15 x2
0.2 -30 -10 15 x3
三种方案的期望收益分别为:
=70×0.3+30×0.5+(-30)×0.2=30(万元) EMVA
=40×0.3+25×0.5+(-10)×0.2=22.5(万元) EMVB
=15×0.3+15×0.5+15×0.2=15(万元) EMVC
.
-
所以按照期望值原则,选A方案。但由于各种因素的不确定性,无论是进行大批量生产还是中批量生产,以及小批量生产都要承担一定的风险。选择大批量生产并不意味着结果一定能获得30万元的收益,而是以30,的概率获得70万元的收益,以50,的概率获得30万元的收益,以20,的概率损失30万元。因而影响期望值的概率和损失都与风险关联,对风险的测定就成为风险决策的重要内容。
我们可以用三个方案的风险系数来测度其风险度,即得到三个方案每一单位期望收益的离散程度指标,该指标越大,则风险度越大。首先,得到三个方案的期望损益标准差:
3322,,,,,,,,()()34.64,()()17.5,CPEMVPxCPEMVPx,,AAiAiBBiBi,,ii11
32,,,,()()0CPEMVPx。因此,三种方案的风险系数为:,CCiCi,i1
34.6417.50VVV,,,,,,。 1.155,0.778,0,,,ABC3022.515
由此可见,尽管进行大批量生产的期望收益较大,但风险也较大。而进行小批量生产虽然期望收益不是最大的,但基本上无风险,即无论销路如何都能获得一定收益,所以C方案也是值得考虑的一种选择。因而,进一步进行灵敏度分析。
若销路状态的分布发生变化:则有:Px()0.2,,PxPx()0.3,()0.5,,,123
=70×0.2+30×0.3+(-30)×0.5=8(万元),=40×0.2+25×0.3+(-10)EMVEMVAB
×0.5=10.5(万元),=15×0.2+15×0.3+15×0.5=15(万元)。结果EMVEMVCC,, ,最优方案应选择小批量生产了。 EMVEMVAB
由上可知,若状态的概率发生变化,会引起最优选择发生变化。因为上述的销路状态的概率是先验概率,未考虑当前和未来可能出现的各种情况。显然,这样选择的最优方案是很不稳定的,灵敏度较高时风险较大。为此,要使期望损益值更准确可靠,决策者应及时取得市场调查信息,不断加大信息量,以减少其中的不确定性。而最简捷的方式就是向市场咨询公司购买产品的市场销路状态预报的信息数据资料,以保证决策的相对准确性。但这种决策信息的收集是需要代价的,那么这笔信息费为多少是合适的呢,
.
-
下面,利用贝叶斯公式对各种状态的概率进行修正,以得出更为可靠的决策
方案。
1.由咨询公司提供的市场销路状态D的信息资料数据如下表
Pyx(),信息D的条件概率值 ji
X(销路状况的先验信息) (信息D提yj
供的销路状况(销路好) (销路一般) (销路差) xxx123预报情况)
0.7 0.3 0.15 (销路好) y1
0.2 0.5 0.25 (销路一般) y2
0.1 0.2 0.6 (销路差) y3
PxyPyxPx()()(),,,2(由公式求得: ijjii
信息D的联合概率值 Pxy()ij
Py()(销路好) (销路一般) (销路差) xxxj123
0.21 0.15 0.03 0.39 (销路y1
好)
0.06 0.25 0.05 0.36 (销路y2
一般)
0.03 0.1 0.12 0.25 (销路y3
差)
0.3 0.5 0.2 1 Px()i
3.利用贝叶斯公式
PyxPx()(),jiiPxy(),求得: ijn
PyxPx()(),,jii,1i
.
-
信息D的条件概率的值 Pxy()ij
xxx123
0.538 0.385 0.077 y1
0.167 0.694 0.139 y2
0.120 0.400 0.480 y3
4,计算掌握了决策信息后的最满意方案的期望收益和风险系数
(1) 在掌握了决策信息的条件下,各方案的期望收益分别为: y1
=70×0.538+30×0.385+(-30)×0.077=46.9(万元) EMVA
=40×0.538+25×0.385+(-10)×0.077=30.375(万元) EMVB
=15×0.538+15×0.385+15×0.077=15(万元) EMVC
可知,在掌握了决策信息的条件下,最满意方案为A方案,期望收益为46.9y1
32()()CPEMVPxy,,,Aii1Ay,()129.2i,1万元,其风险系数为:,V,,,0.623,,Ay()1EMV46.9,Ay()11.155
(2) 在掌握了决策信息的条件下,各方案的期望收益分别为: y2
EMV=70×0.167+30×0.694+(-30)×0.139=28.34(万元) ()Ay,2
EMV=40×0.167+25×0.694+(-10)×0.139=22.64(万元) ()By,2
EMV=15×0.167+15×0.694+15×0.139=15(万元) ()Cy,2
可知,在掌握了决策信息的条件下,最满意方案仍为A方案,其风险系数为: y2
32()()CPEMVPxy,,,Aii2,Ay()227.66,i1,1.155 V,,,0.976,Ay,()2EMV28.34Ay,()2
(3)在掌握了决策信息的条件下,各方案的期望收益分别为: y3
.
-
EMV=70×0.120+30×0.400+(-30)×0.480=6(万元) ()Ay,3
EMV=40×0.120+25×0.400+(-10)×0.480=10(万元) ()By,3
EMV=15×0.120+15×0.400+15×0.480=15(万元) ()Cy,3
可知,在掌握了决策信息的条件下,最满意的方案为C方案,其风险系数y3
32()()CPEMVPxy,,,Cii3Cy,()30i,1为: V,,,0,,Cy()3EMV15,Cy()3
因此,掌握了全部信息值的期望收益为:
EMVPyEMVPyEMVPy()()(),,=46.9×0.39+28.34×0.36+15×123AyAyCy,,,()()()123
0.25=32.24(万元)
信息的价值为32.24-30=2.24(万元)
计算结果表明,资讯费不超过2.24万元,厂商购买该信息数据资料是有利可图的。并且,后验最满意方案的风险系数均小于或等于后验最满意方案的风险系数。由此可知,决策信息量越充分,市场不确定性越小,决策风险也就越小。由期望值分析法得到的后验最满意方案,才应当是最优的决策方案。
值得注意的是,决策者最终所采取的决策行为带有很大的主观性,决策结果和决策者的风险态度有关。我们可以在具体的决策分析中,同时运用几种方法进行决策,如果在期望值分析法的基础上,引入后验分布进行信息价值分析,就是一种提高决策者决策可靠性的有效方法。
.
范文二:贝叶斯公式论文
哈尔滨学院本科毕业论文(设计)
题目: 贝叶斯公式公式在数学模型中的应用
院(系) 理学院
专 业
年 级
姓 名
指导教师
数学与应用数学 2009级 鲁威 张俊超 学 号 09031213 职 称 讲师
2013 年 6月 1 日
目 录
摘 要 .......................................................................................................................................... 1
Abstract ....................................................................................................................................... 2
前 言 .......................................................................................................................................... 3
第一章 贝叶斯公式及全概率公式的推广概述 ..................................... 错误!未定义书签。
1.1 贝叶斯公式与证明 . .......................................................................................................... 5
1.1 贝叶斯公式及其与全概率公式的联系 . .......................................................................... 5
1.3 贝叶斯公式公式推广与证明 . .......................................................................................... 6
1.3.1贝叶斯公式的推广 ................................................................................................... 6
1.4 贝叶斯公式的推广总结 . .................................................................................................. 7
第二章 贝叶斯公式在数学模型中的应用 ................................................................................ 8
2.1数学建模的过程 ............................................................................................................... 8
2.2 贝叶斯中常见的数学模型问题 . ...................................................................................... 9
2.2.1 全概率公式在医疗诊断中的应用 .......................................................................... 9
2.2.2全概率公式在市场预测中的应用 ......................................................................... 11
2.2.3全概率公式在信号估计中的应用. ...................................... 错误!未定义书签。
2.2.4全概率公式在概率推理中的应用 ......................................................................... 15
2.2.5全概率公式在工厂产品检查中的应用 ................................ 错误!未定义书签。
2.3全概率公式的推广在风险决策中的应用 ..................................................................... 17
2.3.1背景简介 ................................................................................................................. 17
2.3.2风险模型 ................................................................................................................. 18
2.3.3实例分析 ................................................................................................................. 18
第三章 总结 .............................................................................................................................. 21
3.1贝叶斯公式的概括 ......................................................................................................... 21
3.2贝叶斯公式的实际应用 ................................................................................................. 21
结束语 ........................................................................................................................................ 23
参考文献 .................................................................................................................................... 24
后 记 ........................................................................................................................................ 25
摘 要
贝叶斯公式在概率论这本书中占有很高的位置,在概率论的运算中也有着不可替代的位置。本文详细的对贝叶斯公式进行了深入的探究,而且列举了一些生活中的实例来说明了他的运用以及他所使用的生活模型,便于以后我们更好深入的理解贝叶斯公式我们必须先要了解全概率公式以及它在实际生活中的运用。简单的贝叶斯公式并不能满足生活中的需求,所以我们把贝叶斯公式进行了深入的了解,并用实际例子证明了贝叶斯公式推广后的公式在生产生活中所适合的模型比以前的贝叶斯公式更加的广阔。数学建模是一种科学的思维方法,随着社会的发展,数学模型运用于各学科以及各领域. 本文通过对一些典型题的分析研究。总体概括出贝叶斯公式和贝叶斯公式的推广在数学模型中实际运用. 构造数学模型更准确的利用贝叶斯公式求解问题的分析问题的方法、解决问题的步骤。
关键词 贝叶斯公式;全概率公式;数学模型;
Abstract
The bayes formula is one important formulas in theory of probability, has a important role in the calculation of probability theory. Carefully analyzed in this paper, the bayes formula, and illustrates his usage and the applicable scheme, in order to better understand the bayes formula we need to introduce the whole probability formula. In order to solve practical problems, we will be the bayes formula for promotion, promotion after the formula in practical application is illustrated by an example of the applicable model wider than the original formula. Mathematical modeling is a kind of scientific thinking method, with the development of the society, the mathematical model used in various disciplines, and in various fields. In this article, through analysis and study of some typical questions. Summarizes the bayes formula and bayes formula promotion application in mathematical model. Mathematical model is set up and better using the bayes formula to solve the problem analysis, problem solving steps.
Key words :The bayes formula; Full probability formula; Mathematical model;
前 言
贝叶斯公式在概率论一书中占有很中要的位置,它集中用于计算相对繁琐事件的发生概率, 它本质上是乘法公式和加法公式的总体运用。概率论与数理统计是探索随即状况统计规律的一门现代数学学科出现于十几世纪。从出现这一门学科以来,已经开始深入到各个科学领域当中并有着举足轻重的位置。从十七世纪到现在很多国家对这个公式有了很多方面的研究。很长时间以来,由于许多这方面工作人员的积极工作,使概率论与数理统计在理论方面有了更深一步的进展,在实际生活中的应用也更加的宽泛了,促成了大小不一的许多分支,在当代数学中有着不可替代的独特位置。贝叶斯公式是在1763年由贝叶斯(Bayes )这位伟大的数学家发现的,它的实质是观察到事件A 已经出现的情况下,寻求致使A 出现的每个原因的概率. 这个公式在我们的生活中有很多的应用在论文中我将逐一介绍。贝叶斯公式可以有助于人们了解一个结果(事件 A)出现的最大的可能性。运用贝叶斯公式我们可以更加简单明了的计算生活中遇到的一些数学问题,她在数学计算中有着很宽泛的应用。其本质就是在将各种前提引进的情况下,先将所给出的样本空间 分成若干份,并可以简单明了的计算出所需结果的概率,最后加以分析得出结果。
在当今社会中,随着发展的飞速前行,市场需求的突飞猛进,领导者不能在着眼于以前的生产信息,而是应该把过往的和现在的生产信息一同考虑分析,做出个比较全面的决策。决定性概率分析越来越显示其重要性。而在其中贝叶斯公式的主要用途就是用于处理先验概率与后验概率,是进行决策的重要工具。
贝叶斯公式可以用来解决医学、市场预测、信号估计、概率推理以及产品检查等一系列不确定的问题。本文首先分析了贝叶斯公式的概念,再用贝叶斯公式来解决实际中的一些问题。然后将贝叶斯公式推广,举例说明推广后的贝叶斯公式在实际应用中所适用的概型。
概率论对医学的渗透与结合,已成为现代医学领域的显著特征。利用数学方法充分利用好贝叶斯公式及其推广形式,定量的对医学问题进行相关分析,使其结论更加有可信度,更有利于促进对病人的对症施治。利用好贝叶斯公式可以用来解决投资、保险、工程等一些列问题中,公式及其推广形式的正确应用有助于进一步研究多个随机实验中目标事件及其条件下诱发事件的概率,有助于把握随机事件相互影响关系,为生产实践提供更有价值的决策信息。灵活使用贝叶斯公式会给我们的解题带来很大方便,而这些推广形式将进一
步拓展贝叶斯公式的适用范围,称为我们解决更复杂问题的有效工具。
本文研究了六类数学模型,阐述了贝叶斯公式及推广的全概率公式在:产品检验模型,销售、决策模型,摸球模型,实际比赛模型,医疗诊断模型,金融保险模型中的应用。财产保险的保险标准的复杂变性, 使得保险精算中赔款额的估计异常重要, 通过应用推广的全概率公式, 本文对存在保险责任判定概率的赔款额进行数学建模, 并由计算实例来阐述相关结论. 全概率公式在数学模型中的应用远远不止这些,本文只是从他的某些方面做了一个概括,总的说来,全概率公式是概率当中一个非常重要而且实用的一个公式,能够在我们的生产实际中发挥着举足轻重的作用。用数学方法,充分利用好全概率公式在数学模型中的应用与推广形式。定量的对实际生活中的问题进行相关分析,使其结论更具可信度。更有利于促进对病人的对症施治, 利用好全概率公式可以用来解决投资, 保险, 工程等一系列不确定的问题中, 全概率及推广形式的正确应用有助于进一步研究多个随机过程的试验中目标事件及其条件下各诱发事件的概率, 有助于把握随机事件间的相互影响关系, 为生产实践提供更有价值的决策信息, 灵活使用全概率公式会给我们的解题带很大方便, 而这些推广形式将进一步拓展全概率的活用范围, 成为我们解决更复杂问题的有效工具。
第一章 贝叶斯公式及全概率公式的推广概述
1.1 贝叶斯公式与证明
设B 1B 2,..., B n 为Ω 的一个分割,即B 1B 2,..., B n 互不相容,且 B i =Ω,如果P( A ) > 0 ,
i =1n
P (B i ) =0 (i =1,2,..., n ) ,则P (B i /A ) =P (B i ) P (A /B i )
∑P (B ) P (A /B ) j j
j =1n , i =1, 2,..., n 。
证明 由条件概率的定义(所谓条件概率,它是指在某事件B 发生的条件下,求另一事件A 的概率,记为P (A /B ) ) P (B i /A ) =P (AB i ) P (A )
对上式的分子用乘法公式、分母用全概率公式,
P (AB i ) =P (B i ) P (A /B i )
P (A ) =∑P (B i ) P (A /B i ) j =1n
P (B i /A ) =P (B i ) P (A /B i )
∑P (B ) P (A /B ) j j
j =1n , i =1, 2,..., n
结论的证。
1.2 贝叶斯公式及其与全概率公式的联系
在介绍了贝叶斯公式以后还得介绍下全概率公式,因为全概率公式和贝叶斯公式是一组互逆公式接下来先来看下全概率公式的概念。
设B 1, B 2, B n 为样本空间Ω的一个分割,即B 1, B 2, B n 互不相容,且U B i =Ω,如果
i =1n
P (B i ) >0. i =1, 2, . n ,则对任一事件A 有P (A ) =∑P (B i ) P (A |B i )
i =1n
证明:因为
A =A Ω=A (U B i ) =U (AB i )
i =1i =1n n
且AB 1, AB 2, , AB n 互不相容,所以由可加性得
P (A ) =P (U (AB i )) =∑P (AB i )
i =1i =1n n
n
再将P (AB i ) =P (B i ) P (A |B i ), i =1, 2, , n 代入上式即得P (A ) =∑P (B i ) P (A |B i )
i =1
由证明可以知道全概率公式其实就是贝叶斯公式的一种变形,它与贝叶斯公式是互逆应用的。它与贝叶斯公式一样在实际生活中也有很广泛的应用。下面来探讨贝叶斯公式在一下几个方面的应用。
1.3 贝叶斯公式推广与证明
1.3.1贝叶斯公式的推广
设当试验的随机过程不少于两个的时候,在影响目标事件的每一个试验过程中分别建立完备事件组,贝叶斯公式就可以进一步推广.
1.3.2贝叶斯公式推广定理
设A i (i =1, 2, n ) 和B j (j =1, 2, , n ) 是先后两个试验过程中的划分,
C 为目标事件. 当P (C ) >0, P (A i ) >0, P (B i ) >0, P (AB i j ) >0, i =1,2, , n , j =1,2, , m 时,则
有:
P (A i ) ∑P (B j |A i ) P (C |A i B j ) m
(1)P (A i |C ) =
n j =1P (C ) , i =1, 2 , n
(2)P (B j |C ) =∑P (A ) P (B i
i =1j |A i ) P (C |A i B j ) , j =1, 2 , m P (C )
P (A i ) P (B j |A i ) P (C |A i B j )
P (C )
m (3)P (A i B j |C ) =, i =1, 2 , n , j =1, , m m
P (AC i ) = 证明:(1):P (A i |C ) =P (C ) ∑P (A B C ) ∑P (A ) P (B i j i j =1j |A i ) P (C |A i B j )
P (C ) =j =1
P (C )
同理可以证明(2)、(3).
1.4 贝叶斯公式推广总结
整理文献之后,能把贝叶斯公式归为两种形式,事件型和随机变量型,这是就样本本身的性质而言的。
上述推广结论,是由不同的技巧推广而来的。从公式的条件出发,讨论拓宽公式应用的面。在经典的贝叶斯公式当中要求事件列是“互不相容”的,这方面削弱了这一条件给出广义的贝叶斯公式,无论相容与否都可以直接计算。从公式的形式出发,增加公式的灵活度。例如:在经典的贝叶斯公式中,样本是离散的,但是实际计算当中,遇到复杂事件的时候,就不太实用了,这时候可以把全概率公式推广到随机变量的情形。当然,随机变量有可能是离散的,或者是连续的,也可能是混合型随机变量,所以我们就可以再利用分布律来求解有关问题。从公式的计算辅助出发,创新的利用公式的推广。用在风险模型的改进、风险计算和风险过程的分析当中。但是,我们可以发现,随机变量的贝叶斯公式的推广结论,要明显少于事件型的推广结论。这一方面是,随机过程是一门很深很难的学科,另一方面,贝叶斯公式还是局限在概率的计算这个问题当中,用于例子的一般计算,采用
事件型就能够完成。
不过,随着各个学科的相互渗透,事件型概率虽然已经有这么多的推广形式值得我们学习和借鉴,但是当遇到实际问题时,还是要对贝叶斯公式形式作一些新的变化,使之能更好的为我们的计算和研究服务。
第二章 贝叶斯公式在数学模型中的应用
数学是一切科学和技术的基础,是研究现实世界数量关系,空间形式的科学。随着社会的发展,电子计算机出现和不断完善,数学不但运用于自然科学各学科,各领域,而且渗透到经济,管理以至于社会科学和社会活动的各领域,众所周知,利用数学解决实际问题,首先要建立数学模型,然后才能在该模型的基础上对实际问题进行分析,计算和研究。
数学建模活动是讨论建立数学模型和解决实际问题的全过程,是一种数学思维方式。
2.1数学建模的过程
数学建模的过程是通过对现实问题的简化,假设,抽象提炼出数学模型,然后运用数学方法各计算机工具等,得到数学上的解答,再把它反馈到现实问题给出解释,分析,并进行检验,若检验结果符合实际或基本符合,就可以用来指导实践否则再假设,再抽象,再修改,再求解再应用,构造数学模型不是一件容易的事,其建模过程和技巧具体主要包括以下步骤
模型准备
在建模前要了解实际问题的背景,明确建模的目的和要求深入调研,去粗取精,去伪存真,找出主要矛盾,并按要求收集必要的数据。
模型假设
在明确目的,掌握资料的基础上,抓住复杂问题的主要矛盾,舍去一些次要因素,对实际问题做出几个适当的假设,使复杂的实际问题得到必要的简化。
建立模型
首先根据主要矛盾确定主要变量,然后利用适当的数学工具刻画变量间的关系,从而形成数学模型模型要尽量简化,不必复杂,以能获得实际问题的满意解为标准。
模型检验
建模后要对模型进行分析,用各种方法求得数学结果,将所求得的答案返回到实际问题中去检验其合理性,并反复修改模型的有关内容,使其更切合实际,从而更具有实用性。
模型应用
用建立的模型分析,解释已有的现象,并预测未来的发展趋势,以便给人们的决策提供参考。总之数学建模是一种创造性劳动,成功的模型往往是科学与艺术的结晶,一个好的数学模型应该具有以下特点:考虑全面,抓住本质;新颖独特,大胆创新,善于检验,结果合理。而模型检验一般包括下列几个方面,稳定性和敏感性分析,统计检验和误差分析新旧模型的比较实际可行性检验因此数学建模的分析方法和操作途径不可能用一些条条框框规定得死板,下面通过实例探析建模过程与技巧。
2.2 贝叶斯中常见的数学模型问题
贝叶斯公式可以作如下解释:假定有n 个两两互斥的“原因” A 1, A 2,..., A n 可引起同一
种“现象”B 的发生,若该现象已经发生,利用贝叶斯公式可以算出由某一个原因A i (j =1,2,..., n ) 所引起的可能性有多大,如果能找到某个A i ,使得
P (A j /B )=max {P (A i /B ) }
1≤i ≤n
则A j 就是引起“现象” B 最大可能的“原因”。 生活中经常会遇到这样的
情况,事件A 已发生, 我们需要判断引起A 发生的“原因”这就需要用到贝叶斯公式来判断引起A 发生的“原因”的概率。贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。
2.2.1贝叶斯公式在医疗诊断上的应用
例1 某地区肝癌的发病率为0.0004,先用甲胎蛋白法进行普查。医学研究表明,化验结果是存在错误的。已知患有肝癌的人其化验结果99%呈阳性(有病),而没有患肝癌的人其化验结果99.9%呈阴性(无病)。现某人的检查结果呈阳性,问他真患肝癌的概率是多少?
解 记B 事件“被检查者患有肝癌”, A 为事件“检查结果为阳性”,有题设知
P (B ) =0.0004 P () =0.9996
P (A /B ) =0.99 P (A /) =0.001
我们现在的目的是求P (B /A ) ,由贝叶斯公式得 P (B /A ) =
=P (B ) P (A /B ) P (B ) P (A /B ) +P (B ) PA /B ) 0.0004?0.99 0.0004?0.99+0.9996?0.001
=0.284
这表明,在检查结果呈阳性的人中,真患肝癌的人不到30%。这个结果可能会使人吃惊,但仔细分析一下就可以理解了。因为肝癌发病率很低,在10000人中越有四人,而约有9996人不患肝癌。对10000个人中,用甲胎蛋白法进行检查,按其错检的概率可知,9996个不患肝癌者中约有约有9996?0.001?90996个呈阳性。另外四个真患肝癌者的检查报告中约有4?0.99?3.96个呈阳性,仅从13.956个呈阳性者中看出,真患肝癌的3.96人约占28.4%。
进一步降低错检的概率是提高检验精度的关键,在实际中由于技术和操作等种种原因,降低错检的概率有事很困难的。所以在实际中,常采用复查的方法来减少错误率。或用另一些简单易行的辅助方法先进行初查,排除了大量明显不是肝癌的人后,再用甲胎蛋白法对被怀疑的对象进行检查,此时被怀疑的对象群体中,肝癌的发病率已大大提高了,譬如,对首次检查得的人群再进行复查,此时P (B ) =0.284,这时再用贝叶斯公式计算得 P (B /A ) =0.284?0.99 0.284?0.99+0.716?0.001
=0.997
这就大大提高了甲胎蛋白法的准确率了。
在上面的例子里面,如果我们将事件B (“被检查者患有肝癌”) 看作是“原因”,将事件A (“检查结果呈阳性”)看作是最后“结果”。则我们用贝叶斯公式在已知“结果”的条件下,求出了“原因”的概率P (B /A ) 。而求“结果”的(无条件)概率P (A ) , 用全概率公式。在上例中若取P (B ) =0.284,则
P (A ) =P (B ) P (A /B ) +P () PA /)
=0.284?0.99+0.716?0.001
=0.2819
条件概率的三公式中,乘法公式是求事件交的概率,全概率公式是求一个复杂事件的概率,而贝叶斯是求一个条件概率。
在贝叶斯公式中,如果P (B i ) 为B i 的先验概率,称P (B i /A ) 为B i 的后验概率,则贝叶
斯公式是专门用于计算后验概率的,也就是通过A 的发生这个新信息,来对B i 的概率作出
的修正。
评注:此例子是现实生活中很常见的一个例子。用了两次贝叶斯公式,第一次利用贝叶斯公式计算出检出是阳性然后患肝癌的概率,第二次利用贝叶斯公式计算出利用甲胎蛋白检测的准确率。通过计算出来的概率,人们采用有效的方法降低错检的概率。使人们的生命财产得到更多的保障。
2.2.2 贝叶斯公式在市场预测中的应用
例2、我们知道,国外的旧车市场很多。出国留学或访问的人有时花很少的钱就可以买一辆相当不错的车,开上几年也没问题。但运气不好时,开不了几天就这儿坏那儿坏的,修车的钱是买车钱的好几倍,经常出毛病带来的烦恼就更别提了。
为了帮助买旧车的人了解各种旧车的质量和性能,国外出版一种专门介绍各品牌旧车以及各年代不同车型各主要部件质量数据的旧车杂志。比如有个买主想买某种型号的旧车,他从旧车杂志上可发现这种旧车平均有30%的传动装置有质量问题。除了从旧车杂志上寻找有关旧车质量的信息外,在旧车市场上买旧车时还需要有懂车的内行来帮忙。比如可以找会修车的朋友帮助开一开,检查各主要部件的质量。因为旧车杂志上给出的是某种
车辆质量的平均信息,就要买的某一辆来讲可能是好的传动装置,也可能会有问题。比较常见的方法是花一点钱请个汽车修理工帮助开几圈,请他帮助判断一下传动装置和其他部件的质量。当然,尽管汽车修理工很有经验,也难免有判断不准的时候。假定从过去的记录知道某个修理工对于传动装置有间题的车,其中90%他可以判断出有问题,另有10%他发现不了其中的问题。对于传动装置没问题的车,他的判断也差不多同样出色,其中80%的车他会判断没问题,另外的20%他会认为有问题,即发生判断的错误。根据这些已知信息请你帮助买主计算如下的问题:
1、若买主不雇用修理工,他买到一辆传动装置有问题的车的概率是多少?
2、若买主花钱雇修理工帮他挑选和判断,当修理工说该车“传动装置有问题”时该车传动装置真有问题的概率是多少?
3、当修理工说该车“传动装置没问题”时而该车传动装置真有问题的概率是多少?
解 1、问题是简单的,即有30%的可能性买到一辆有传动装置间题的旧车,我们在这里只利用旧车杂志的信息。
第2问和第3问是贝叶斯估计或者利用贝叶斯公式进行决策的问题。
2、我们知道,贝叶斯公式是个条件概率的公式,即
P (A i /B ) =P (A i ) P (B /A i )
k
j ∑P (A ) P (B /A ) j
j =1
其中P (A i /B ) 称为事件A i 的后验概率,即在已知事件B 发生条件下事件A i 发生的概
率;P (A i ) 是事件A i 的先验概率;P (B /A i ) 称为样本信息,即在A i 发生条件下事件B 的概
率。对于第2问,我们不妨令:
A 1=实际有问题,A 2=实际没问题
B 1=修理工判断“有问题”, B 2=修理工判断“没问题”
则可将贝叶斯公式改写成:
P (实际有问题/修理工判断“有问题”)
=P (实际有问题)P (修理工判断“有问题”/实际有问题)
P (实际有问题)P (修理工判断“有问题”/实际有问题)+P (实际没问题)P (修理工判断“有问题”/实际没问题)
=P (A 1) P (B 1/A 1) P (A 1) P (B 1/A 1) +P (A 2) P (B 1/A 2)
根据已知条件,计算式中各项的概率分别为:
P (A 1) =P (实际有问题)=0.3
P (A 2) =P (实际没问题)=0.7
P (B 1/A 1) =P (修理工判断“有问题”/实际有问题)=0.9
P (B 1/A 2) =P (修理工判断“有问题”/实际没问题)=0.2
P (B 2/A 1) =P (修理工判断“没问题”/实际没问题)=0.1
P (B 2/A 2) =P (修理工判断“没问题”/实际没问题)=0.8
代入上式
P (实际有问题/修理工判断“有问题”)=P (A 1) P (B 1/A 1) P (A 1) P (B 1/A 1) +P (A 2) P (B 1/A 2)
=0.3?0.9 0.3?0.9+0.7?0.2
=0.66
这个结果表明,当修理工判断某辆车的传动装置“有问题”时,实际有问题的概率为0.66,即修理工的判断有问题使得真有问题的概率由0.30增长到0. 66。
3、P (实际有问题/修理工判断“没问题”)
=P (实际有问题)P (修理工判断“没问题”/实际有问题)
P (实际有问题)P (修理工判断“没问题”/实际有问题)+P (实际没问题)P (修理工判断“没问题”/实际没问题)
=P (A 1) P (B 1/A 1) P (A 1) P (B 2/A 1) +P (A 2) P (B 2/A 2)
由问题2知道
P (实际有问题/修理工判断“没问题”)
=P (A 1) P (B 2/A 1) P (A 1) P (B 2/A 1) +P (A 2) P (B 2/A 2)
=0.1?0.3 0.3?0.1+0.7?0.8
=0.05
这个结果表明,当修理工判断某辆车的传动装置“没问题”时,实际有问题的概率为0.05,即修理工的判断没问题而实际上有问题的概率由0.3下降到0.05。
评注 这是一个生活中很常见的问题。利用贝叶斯公式计算出买主花钱雇修理工帮他挑选和判断,当修理工说该车“传动装置有问题”时该车传动装置真有问题的概率,当修理工说该车“传动装置没问题”时而该车传动装置真有问题的概率。如果买主没有请修理工,他买到的旧车有质量问题的概率高达0.3,但是如果请修理工帮忙试车的话买到的旧车有质量问题的概率却可以降到0.05。这样不仅为买主剩下较多修车的钱,还帮助买主避免了日后的很多麻烦。
2.2.3 贝叶斯公式在信号估计中的应用
例3 背景:1948年,美国科学家香农发表了著名的论文《通信的数学理论》。世界上第一个给通信系统建立了数学模型。他认为通信系统由以下几个基本要素组成:信源、信道、编码、译码和干扰源。
信源指产生信息的来源。信道指传递信息的通道。将噪声统一为干扰源。编码是从消息到信号的函数,而译码是从信号到消息的函数。
因为信源发出什么消息是随机的,所以信源发出的消息可用随机变量来表示,于是可以用随机变量的分布律来描述信源。
信道由三个因素构成:输入信号,输出信号,以及输入信号与输出信号间的统计联系转移概率。转移概率一般用转移概率矩阵表示。
当信源发出某个消息后,由编码转变为信号,信号通过信道,因为信道中存在干扰,所以进入信道的是某个信号,从信道出来的可能不再是这个信号。那么自然我们要问,当接收到一个信号后,进入信道的信号是什么?
解 建模:有一个通信系统,假设信源发射0、1两个状态信号(我们将编码过程省略),其中发0的概率为0.55,发1的概率为0.45。无论信源发送的是什么,接收端可能接收到的是0,1,或“不清”。它的转移概率矩阵为:
?0.90.050.05??0.050.850.1? ??
分析: 利用贝叶斯公式求解, 设事件A 表示信源发出“0”的信号,表示信源发出“1”的信号,B 表示接收到一个“1”的信号。当B 发生后,分别计算事件A 与事件的概率。 由贝叶斯公式:
P (A /B ) =P (A ) P (B /A ) P (A ) P (B /A ) +P () P (B /)
=0.067
P (/B ) =P () P (B /) P (A ) P (B /A ) +P () P (B /)
=0.933
因为 P (A /B )
比信源发出的是“1”的可能性小得多,所以我们应该判断信源发出的信号是“1”。 评注 某一信号在传输后得到各种信号的概率称为转移概率(包括得到它自身)。此例子运用贝叶斯公式,求得当B 发生后,分别计算事件A 与事件的概率,人们通过此概率可以做出最好的决策。
2.2.4 贝叶斯公式在概率推理中的应用
例4、有朋自远方来,他坐火车、坐船、坐汽车、坐飞机的概率分别是0.3,0.2,0.1,0.4,而他坐火车、坐船、坐汽车、坐飞机迟到的概率分别是0.25,0.3,0.1,0,实际上他是迟到了,推测他坐那种交通工具来的可能性大。
解 设A 1={做火车来} A 2={坐船来}
A 3={坐汽车来} A 4={坐飞机来}
B ={迟到}
P (A 1) =0.3 P (A 2) =0.2
P (A 3) =0.1 P (A 4) =0.4
P (B /A 1) =0.25 P (B /A 2) =0.3
P (B /A 3) =0.1 P (B /A 4) =0
由贝叶斯公式分别可以算得 P (A 1/B ) =P (A 1) P (B /A 1)
4
∑P (A ) P (B /A ) i i
i =1
=0.3?0.25 0.3?0.25+0.2?0.3+0.1?0.1+0.4?0
0.3?0.25≈0.5172 0.145 =
P (A 2/B ) =P (A 2) P (B /A 2)
∑P (A ) P (B /A ) i i
i =14
=
0.2?0.3≈0.4184 0.145
P (A 3/B ) =P (A 3) P (B /A 3)
∑P (A ) P (B /A ) 1i
i =14
=
0.1?0.1≈0.0690 0.145
P (A 4/B ) =P (A 3) P (B /A 3)
∑P (A ) P (B /A ) i i
i =14=0
比较以上四个概率值,可见他坐火车和坐船的概率大,坐汽车的可能性很小,且不可能是坐飞机过来的。
评注 此例子运用了四次贝叶斯公式,用所求出的概率判断某人迟到了,选择了何种交通工具的可能行最大。由果索因, 果是某人迟到了,因是某人选择了那种交通工具。
2.2.5 贝叶斯公式在工厂产品检查中的应用
例5、某厂生产的产品次品率为0.1%,但是没有适当的仪器进行检验,有人声称发明一种仪器可以用来检验,误判的概率仅为5%.试问厂长能否采用该人所发明的仪器?
分析:“5%的误判率”给检验带来怎样的可信度,这是厂长决策的依据,即弄清“被检验出的正(或次) 品中实际正(或次) 品率”.
解:设事件A 表示“客观的次品”,事件B 表示“经检验判为次品的产品”,由题意知: P (A ) =0.001, P () =0.999,P (B |A ) =0.95, P (B |) =0.05.
由贝叶斯公式可计算“被检验出的次品中实际次品率”为: P (A |B ) =P (A ) P (B |A )
P (A ) P (B |A ) +P () P (B |) =0.001?0.95 0.001?0.95+0.999?0.05
≈0.018664
同理,“被检验出的正品中实际正品率”为: P (|) ≈0.999947
由P (A |B ) =0.018664可知,如果产品的成本较高,厂长就不能采用这
仪器,因为被仪器判为次品的产品中实际上有98%以上的是正品,这样导致损耗过高. 同时,我们也注意到该仪器对正品的检验还是相当精确的,若检验对产品没有破坏作用,倒是可以在“被认定次品”的产品中反复检验,挑出“假次品”,这就降低了损耗,又保证了正品具有较高的可信度.
2.3贝叶斯公式的推广在风险决策模型中的应用
2.3.1背景简介
信息是决策的基础。由于市场环境中存在大量不确定因素和决策者本身知识能力的限制,再加上统计信息的不充分,决策者往往无法掌握与决策有关的所有信息,的决策必然
会给决策者带来某种程度的风险。信息是减少风险的有力手段。! 信息越充分,决策环境的不确定性越小,风险也就越小。于是贝叶斯公式在风险决策中作为判断风险大小的工具就显的尤为重要。
2.3.2风险模型
以离散情况为例,设风险决策问题为:(Ω, A , Q ) ),状态集Ω={x i }, i =1, 2, Λ, n , 行动集A ={a k }, k =1, 2, Λ, n ,收益/损失函数为Q =Q x i , a k . 状态变量的先验分布为
P (x i ), i =1, 2, Λ, s . ,决策信息值为y j , j =1, 2, Λ, s . 。决策信息值的准确率为:p (y j x i ),即在状()态值x i 的条件下,信息值y j 的准确率。则状态变量的后验分布的贝叶斯公式为:p (y j x i )=p (y j x i )p (x i )
∑p (y
i =1n j x i )p (x i ).
2.3.3实例分析
某厂商要确定下一计划期内产品的生产批量,有三种方案可供选择,即大批量生产(A )、中批量生
产(B )、小批量生产(C )。市场的销路状态有三种:销路好(x 1)、销路一般(x 2)、销路差(x 3),根据以前的资料,销路状态分布为p (x 1)=0. 3,p (x 2)=0. 5, p (x 3)
=0. 2三种生产方案在不同需求状态下的收益如下表所示:
三种方案的期望收益分别为:
EMV A =70*0. 3+30*0. 5+(-30) *0. 2=30(万元)
EMV B =40*0. 3+25+0. 5+(-10) *o . 2=22. 5(万元)
EMV C =15*0. 3+15*0. 5+15*0. 2=15(万元)
结果是EMV A >EMV B >EMV C ,所以按照期望值原则,选A 方案。但由于未来各种因素的不确定性,无论是进行大批量生产还是中批量生产,以及小批量生产都要承担一定的风险。选择大批量生产并不意味着结果一定能获得30万元的收益,而是以70%的概率(市场销路好)获得)30万元的收益,以50%:的概率获得30 万元的收益,以20%:的概率损失获得30 万元的收益。因而影响期望值的概率和损益都与风险关联,对风险的测定就成为风险决策的重要内容。我们可以用三个方案的风险系数来测度其风险度,即得到三个方案每一单位期望收益的离散程度指标。该指标越大,则风险度越大,决策风险就越大。首先得到三个方案的期望损益标准差: δA =∑(cp Ai
i =13-EMV A )p (x i ) =34. 64,δB =17. 5, δC =0 2
因此,三方案的风险系数为:V δA =34. 6417. 5=1. 155, V δB ==0. 778, V δC =0. 由此可见,尽3022. 5
管进行大批量生产的期望收益较大,但风险也较大。而进行小批量生产虽然期望收益不是最大的,但基本上无风险,即无论销路如何都能获得一定收益,所以c 方案也是值得考虑的一种选择。因而,进一步进行灵敏度分析。
若销路状态的分布发生变化:P (x 1) =0. 2, P (x 2) =0. 3, P (x 3) =0. 5则有:
EMV A =70*0. 2+30*0. 3+(-30) *0. 5=8(万元)
EMV B =40*0. 2+25*0. 3+(-10) *0. 5=10. 5(万元)
EMV C =15*0. 2+15*0. 3+15*0. 5=15(万元)
结果是EMV C >EMV B >EMV A ,最优方案应选择为小批量生产了。
由上可知,若状态的概率发生变化,会引起最优选择发生变化。因为上述的销路状态的概率是先验概率,未考虑当前和未来可能出现的各种情况,显然,这样选择的最优方案是很
不稳定的,灵敏度较高时,风险较大。为此,要使期望损益值更准确可靠,决策者应及时取得市场调查信息,不断加大信息量,以减少其中的不确定性。而最简捷的方式就是向市场咨讯公司购买产品的市场销路状态预报的信息数据资料,以保证决策的相对准确性。 因此在风险决策中,需要根据已经掌握的信息,通过借助贝叶斯公式得出最佳的决策方案。 如果需要是决策风险降低,则企业需要搜集更多的信息,运用贝叶斯公式计算不同方案下的不同收益,找出最优方案。
第三章 总结
3.1全概率公式的概括
贝叶斯公式是概率论中的一个重要公式,在实际中有广泛的应用。本文对贝叶斯公式做了全面的分析,对应用贝叶斯公式的详细做了分析,并给出了应用全概率解决实际问题的实际步骤。此外还对贝叶斯公式的条件做了一系列推广,扩大了贝叶斯公式的应用范围。
本文详细介绍了贝叶斯公式及贝叶斯公式的应用,贝叶斯公式的推广及其在数学模型中的应用,通过这些详细的讲述,我们知道贝叶斯公式是一个由原因推出结果的公式,贝叶斯公式的应用也是多方面的,灵活使用贝叶斯公式会给我们的解题带来很大方便,而贝叶斯公式的推广形式将进一步拓展了概率公式的使用范围,成为我们解决更复杂问题的有效工具。
3.2全概率公式的实际应用
贝叶斯公式在实际中有许多应用。例如, 解决医学、市场预测、信号估计、概率推理以及产品检查等一系列不确定的问题用全概率公式来解决会很方便。生活中这样的例子还有很多,解决这些实际问题可以首先将它们转化为数学模型,然后利用求解全概率的方法来得到最优解,进而得出这些实际问题的最终结论。
贝叶斯公式在很多数学模型中有很重要的作用。对贝叶斯公式进行仔细地分析,用例子说明了它的用法及它所适用的概型,为了解决实际问题的需要,我们将贝叶斯公式进行了推广,用例子说明了推广的贝叶斯公式在实际应用中所适用的概型比贝叶斯公式的更广因此,贝叶斯公式在数学模型的求解中有着十分广泛的作用,它是数学模型中一个经常会
被用到的工具。社会在飞速发展,决策者必须综合考察已往的信息及现状从而作出综合判断,决策概率分析越来越显示其重要性。其中贝叶斯公式主要用于处理先验概率与后验概率,是进行决策的重要工具。
结 束 语
随着社会的飞速发展,市场竞争日趋激烈,决策者必须综合考察已往的信息及现状从而作出综合判断,利用概率来决策越来越显得重要。利用贝叶斯公式定量地对医学问题进行相关分析,使其结论具有与可信度,更有利于促进对病人的对症施治等。
本文详细地介绍了贝叶斯公式的定义,贝叶斯公式在医学诊断、市场预测、信号估计、概率推理以及风险投资等方面的应用,并介绍了贝叶斯公式的推广定理以及其推广定理在摸球模型中的应用。
通过本次研究,我知道了贝叶斯公式在日常生活中的许多应用,很多时候我们可以利用贝叶斯公式来进行决策、推理判断等。但由于对贝叶斯公式研究的时间比较短,此次研究还存在很多不足之处。本文只是列举了几个例子来说明贝叶斯公式的应用,事实上贝叶斯公式的应用远远不止这些,贝叶斯公式还可以用来解决保险、工程、垃圾邮件的处理等一系列不确定的问题。
参 考文献
[1] 林元烈. 应用随机过程[M]. 北京:清华大学出版社2008
[2] 孙荣恒, 随机过程及其应用[M],北京:清华大学出版社,2004.5-6
[3] 孙荣恒, 应用概率论[M].北京:科学出版社,2006:28-29.96
[4] 辛玉东, 弓小影, 连续型全概率公式的特殊应用[J].中国科技信息:2007.5.228
[5] 茆诗松, 程依明, 濮晓龙, 概率论与数理统计教程[M].北京:高等教育出版社,2004.24-25
[6] 盛骤, 谢式千, 潘承毅, 概率论与数理统计[M]北京:高等教育出版社,2001.18-20
[7] 龚冬保. 概率论与数理统计典型题[M]西安:西安文通大学出版社,2003.30-35
[8] 蓝松, 保险概论[M].成都:西南财经大学出版社,1997.100-121
[9] 龙永红,《概率论与数理统计》,高等教育出版社,2004.2第二版
[10] 梁之舜,邓集贤,杨维权,司徒荣,邓永录,《概率论及数理统计》,中山大学数学系高等教育出
版社,1996.4
[11] 龚德恩,范培华,胡显佑,《经济数学基础——概率统计》,四川人民出版社,2000.2
[12] 陈晓兰。刘蒲凰,《概率论及数理统计》,经济科学出版社,2004.6
[13] 陈希孺,《概率论与数理统计》,中国科学技术出版社,1996版
[14] 周概容,《概率论与数理统计》,高等教育出版社,1986年版
[15] 首都师范大学数学系概率统计教研室编,《概率论与数理统计》,首都师范大学出版社1992.4
后 记
四年的读书生活在这个季节即将划上一个句号,而于我的人生却只是一个逗号,我将面对又一次征程的开始。四年的求学生涯在师长、亲友的大力支持下,走得辛苦却也收获满囊,在论文即将付梓之际,思绪万千,心情久久不能平静。 伟人、名人为我所崇拜,可是我更急切地要把我的敬意和赞美献给一位平凡的人,我的导师。我不是您最出色的学生,而您却是我最尊敬的老师。您治学严谨,学识渊博,思想深邃,视野雄阔,为我营造了一种良好的精神氛围。授人以鱼不如授人以渔,置身其间,耳濡目染,潜移默化,使我不仅接受了全新的思想观念,树立了宏伟的学术目标,领会了基本的思考方式,从论文题目的选定到论文写作的指导, 点拨, 再经思考后的领悟, 常常让我有“山重水复疑无路, 柳暗花明又一村”。
感谢我的爸爸妈妈,焉得谖草,言树之背,养育之恩,无以回报,你们永远健康快乐是我最大的心愿。在论文即将完成之际,我的心情无法平静,从开始进入课题到论文的顺利完成,有多少可敬的师长、同学、朋友给了我无言的帮助,在这里请接受我诚挚谢意! 同时也感谢学院为我提供良好的做毕业设计的环境。 最后再一次感谢所有在毕业设计中曾经帮助过我的良师益友和同学,以及在设计中被我引用或参考的论著的作者。
范文三:关于贝叶斯_韩明
中国统计
2014.9
关于贝叶斯
文/韩 明
2013年恰逢贝叶斯定理发表250周年,国内外有关学术团体组织了一系列纪念活动。本文借纪念贝叶斯定理发表250周年的机会,简要地介绍贝叶斯统计的兴起、发展和应用情况。
在国际统计学术界中有两大学派——贝叶斯学派和经典学派(或频率学派),这两个学派之间长期存在争论,至今没有定论。在上个世纪,Lindley 教授曾预言21世纪将是贝叶斯统计的天下,Efron 教授则认为出现这种局面的主观概率为0.15。事实上,这两个学派的争论构成了现代统计学发展的一个特色。这两个学派的学者们都承认,这场争论对现代统计学的发展起到了积极的促进作用。
日,其影响日益扩大。
贝叶斯统计的起源,一般要追溯到Bayes 的论文(1673),该论文包含了通常的《概率论与数理统计》教材中人所共知的贝叶斯定理(也称贝叶斯公式),时隔二百多年后的现代贝叶斯学派,其基本思想和施行方法,仍然是这个定理。如果把1900年作为近代数理统计学开始的一年,则到现在为止的110多年中,前半期——约到二战结束时为止,可以说基本上是经典学派一统天下。但随着统计应用的扩大,贝叶斯统计受到欢迎。
1812 年,Laplace 在他的概率论教科书第一版中首次将贝叶斯思想以贝叶斯定理的现代形式展示给世人。Laplace 本人不仅重新发现了贝叶斯定理,阐述得远比贝叶斯更为清晰,而且还用它来解决天体力学、医学、甚至法学问题。值得一提的是, Press (1989)的书《Bayes statistics: Principles, Models, and Applications》中除了对贝叶斯学派观点和在当时的应用实例作了充分介绍外,另一个显著特点是全文刊录了贝叶斯的论文原作,并对贝叶斯的生平作了详细的介绍。了解一下贝叶斯的生平,读一读他的原著,有助于我们亲身去体会贝叶斯的思想和方法。
经典统计是指二十世纪初,由Pearson 等人开始,经Fisher 的发展,
到Neyman 完成理论的一系列成果。在目前国内外已出版的统计教材中,经典统计的理论和方法占有绝大部分。实践证明,经典统计的理论和方法是很有意义的,它指导人们在许多领域中做出了重要贡献。
贝叶斯统计是基于贝叶斯定理而发展起来用于系统地阐述和解决统计问题的方法。贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息结合,再根据贝叶斯定理得出后验信息,然后根据后验信息进行统计推断 。
由于频率学派与贝叶斯学派在基本观点上存在根本性的差异,因此,它们之间的争论和对对方的批评是不可避免的。从理论的高度来看,我们必须注意这样一个基本点:统计推断是在不掌握完全信息条件下的推断,也就是说,所掌握的信息还不足以决定问题的唯一解,这就提供了建立多种理论体系和方法的可能。事实上,两个学派都有其成功和不足的地方, 都有广阔的发展前景,在应用上是相辅相成的。
一、贝叶斯统计的兴起和发展
英国学者Thomas Bayes(1702—1761) 于1763年在《机遇理论中一个问题的解》中,提出了一种归纳推理的理论,其中最重要的是被称为后人称为“贝叶斯定理”,以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法。采用这种方法作统计推断所得的全部结果,构成贝叶斯统计的内容。认为贝叶斯方法是唯一合理的统计推断方法,组成统计学中的贝叶斯学派,其形成可追溯到20世纪30年代。到20世纪50—60年代,已发展为一个有影响的学派。时至今
二、贝叶斯统计的广泛应用
随着贝叶斯统计的兴起与发展,贝叶斯统计得到了广泛的应用。目前,贝叶斯学派已经成为当前两大统计学派之一,
并在实践中获得了广泛应用。
32
从国内外的文献资料来看,贝叶斯统计推断理论几乎可以作为每一个学科的研究工具之一,它既可以用于质量控制、软件质量评估、核电站可靠性评价和缓慢周转物品的存储问题、垃圾邮件的分类,又可以应用于水文事件频率的估计、犯罪学不完全记数的估计以及保险精算;尤其是,近年来贝叶斯统计理论在宏观经济预测中取得了巨大的成功,因此贝叶斯方法获得越来越多专家学者的认同。
贝叶斯方法的应用很广泛,在经济、金融、保险、生物、医学、生态学、可靠性、机器学习等方面都十分活跃。“外科和麻醉疗法的革新成功率如何?”以及“测定作品的所有权”等都是贝叶斯统计成功应用的案例。诸如此类的例子实在难以一一罗列,以下简要地介绍具有代表性的几个方面的应用。
(一)在经济、金融和保险中的应用
Zellner 教授的书《An Introduction to Bayesian Analysis in Econometrics》的出版标志着贝叶斯计量经济学的诞生。当代许多杰出的计量经济学家都应用贝叶斯计量经济学解决经济问题。2006年Poirier 对1970—2000年间几种重要的期刊在经济和计量经济学文章中使用的贝叶斯方法数量发展速度进行了回顾。
(二)在生物、医学中的应用在以前,贝叶斯统计一直都被生物统计所忽略,Cornfield 在1965年发表的关于贝叶斯统计及其应用展望的文章使得生物统计学家开始认真对待贝叶斯统计思想。在临床试验,基因疾病的关系,职业病的防治,病毒学方面,环境性流行病研究以及牙医学方面,需要在可能相关的条件下估计代表不同处理的未知参数。经验贝叶斯理论在这方面发展的很快。在临床试验,流行病学等领域,贝叶斯统计发挥了重要的作用。在生物统计中,纵向数据的研究是很重要的,Laird & Ware 在1982年关于随机效应混合模型做了很多工作,强调了REML 估计和贝叶斯估计之间的关系以提供一个通
过EM 算法对估计和计算的统一处理。
(三)在可靠性中的应用可靠性是产品寿命指标的总称,因此产品的寿命指标又称为产品的可靠性指标。它反映了一个产品在规定的时间内和规定的条件下完成规定功能的能力。小到一个元件,大到一个系统,由于其寿命是一个随机变量,所以确定可靠性指标就归结为统计推断问题。
美国在1982年出版了Martz & Waller的书《Bayesian Reliability Analysis 》,系统地介绍了贝叶斯方法在可靠性中的应用。贝叶斯方法在可靠性中的应用的一个成功案例是,美国研制MX 导弹时,应用贝叶斯方法把发射试验从原来的36次减少到25次,可靠性却从0.72提高到0.93, 节省费用二亿五千万美元。
在我国,1990年《数理统计与应用概率》杂志(第5卷第4期)有一期“贝叶斯专辑”,其中多数论文是贝叶斯方法在可靠性中的应用。在《应用概率统计》、《数理统计与管理》、《统计与决策》等杂志上也经常可以看到贝叶斯方法在可靠性中的应用方面的论文。
(四)在机器学习中的应用机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。在机器学习中,贝叶斯学习是一个重要内容,近几年来发展很快,受到人们的关注。贝叶斯分类器是基于贝叶斯学习方法的分类器,其原理虽然较简单,但是其在实际应用中很成功。机器学习与数据挖掘(Data mining)是紧密联系的,关于数据挖掘对统计学的挑战。
(五)贝叶斯定理成为Google 计算的新力量
搜索巨人Google 和一家出售信息恢复工具的Autonomy 公司,都使用了贝叶斯定理为数据搜索提供近似的结果。研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系,创建个人机器人,开发能够根据数据和经验来决定行动的人工智能设备。
1982. 49.
贝叶斯定理的思想改变了人们和计算机互动的方式。Google 的安全质量总监彼得说:“这种想法是计算机能够更像一个帮助者而不仅仅是一个终端设备,你在寻找的是一些指导,而不是一个标准答案”。
参考文献
[1] Efron B. Bayes' Theorem in the 21st Century[J].Science, 2013, 340:1177-1178.
[2] Kotz.S, 吴喜之. 现代贝叶斯统计学[M].北京:中国统计出版社. 2000.
[3] Press S J. Bayesian statistics: principles, models, and applications [M]. New York. John Wiley and Sons, In c. 1989 (中译本:贝叶斯统计学: 原理、模型及应用. 廖文 等译, 袁卫 校. 北京: 中国统计出版社, 1992).
[4]茆诗松. 贝叶斯统计[M], 北京: 中国统计出版社,1999.
[5]Zellner A. An introduction to Bayesian inference in econometrics [M]. New York: Wiley, 1971 (中译本: 计量经济学贝叶斯推断引论. 张尧庭 译, 蒋传海, 沈根祥 校. 上海: 上海财经大学出版社, 2005).
[6] Qin D. Bayesian econometrics: the first twenty years[J]. Econometric Theory. 1996,12(3):500-516.
[7]朱慧明, 林静. 贝叶斯计量经济模型[M].科学出版社, 2009.
[8]王春峰, 万海辉, 李刚. 基于MCMC 的金融市场风险VaR 的估计[J]. 管理科学学报, 2000,3(2):54-61.
[9]郑进城, 朱慧明. 基于MCMC 方法的贝叶斯AR(p)模型分析[J].统计与决策,2005,10:4-6.
[10]刘乐平, 袁卫. 现代Bayes 方法在精算学中的应用及展望[J]. 统计研究, 2002, 8: 45-
[11] Martz H. F, Waller R A. Bayesian Reliability Analysis [M]. New York: John Wiley,
[12]韩明. 数据挖掘及其对统计学的挑战[J]. 统计研究. 2001,18(8): 55-57.
作者单位:宁波工程学院理学院统计系
33
范文四:贝叶斯的例子
一、什么是贝叶斯推断
贝叶斯推断(Bayesian inference)是一种统计学方法,用来估计统计量的某种性质。
它是贝叶斯定理(Bayes' theorem)的应用。英国数学家托马斯?贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。
贝叶斯推断与其他统计学推断方法截然不同。它建立在主观判断的基础上,也就是说,你可以不需要客观证据,先估计一个值,然后根据实际结果不断修正。正是因为它的主观性太强,曾经遭到许多统计学家的诟病。
贝叶斯推断需要大量的计算,因此历史上很长一段时间,无法得到广泛应用。只有计算机诞生以后,它才获得真正的重视。人们发现,许多统计量是无法事先进行客观判断的,而互联网时代出现的大型数据集,再加上高速运算能力,为验证
这些统计量提供了方便,也为应用贝叶斯推断创造了条件,它的威力正在日益显现。
二、贝叶斯定理
要理解贝叶斯推断,必须先理解贝叶斯定理。后者实际上就是计算"条件概率"的公式。
所谓"条件概率"(Conditional probability),就是指在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。
根据文氏图,可以很清楚地看到在事件B发生的情况下,事件A发生的概率就是P(A?B)除以P(B)。
因此,
同理可得,
所以,
即
这就是条件概率的计算公式。
三、全概率公式
由于后面要用到,所以除了条件概率以外,这里还要推导全概率公式。
假定样本空间S,是两个事件A与A'的和。
上图中,红色部分是事件A,绿色部分是事件A',它们共同构成了样本空间S。 在这种情况下,事件B可以划分成两个部分。
即
在上一节的推导当中,我们已知
所以,
这就是全概率公式。它的含义是,如果A和A'构成样本空间的一个划分,那么事件B的概率,就等于A和A'的概率分别乘以B对这两个事件的条件概率之和。 将这个公式代入上一节的条件概率公式,就得到了条件概率的另一种写法:
四、贝叶斯推断的含义
对条件概率公式进行变形,可以得到如下形式:
我们把P(A)称为"先验概率"(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。P(B|A)/P(B)称为"可能性函数"(Likelyhood),这是一个调整因子,使得预估概率更接近真实概率。
所以,条件概率可以理解成下面的式子:
后验概率 , 先验概率 , 调整因子
这就是贝叶斯推断的含义。我们先预估一个"先验概率",然后加入实验结果,看这个实验到底是增强还是削弱了"先验概率",由此得到更接近事实的"后验概率"。 在这里,如果"可能性函数"P(B|A)/P(B)>1,意味着"先验概率"被增强,事件A的发生的可能性变大;如果"可能性函数"=1,意味着B事件无助于判断事件A的可能性;如果"可能性函数"<1,意味着"先验概率"被削弱,事件a的可能性变小。 五、【例子】水果糖问题="">1,意味着"先验概率"被削弱,事件a的可能性变小。>
为了加深对贝叶斯推断的理解,我们看两个例子。
第一个例子。两个一模一样的碗,一号碗有30颗水果糖和10颗巧克力糖,二号碗有水果糖和巧克力糖各20颗。现在随机选择一个碗,从中摸出一颗糖,发现是水果糖。请问这颗水果糖来自一号碗的概率有多大,
我们假定,H1表示一号碗,H2表示二号碗。由于这两个碗是一样的,所以P(H1)=P(H2),也就是说,在取出水果糖之前,这两个碗被选中的概率相同。因此,P(H1)=0.5,我们把这个概率就叫做"先验概率",即没有做实验之前,来自一号碗的概率是0.5。
再假定,E表示水果糖,所以问题就变成了在已知E的情况下,来自一号碗的概率有多大,即求P(H1|E)。我们把这个概率叫做"后验概率",即在E事件发生之后,对P(H1)的修正。
根据条件概率公式,得到
已知,P(H1)等于0.5,P(E|H1)为一号碗中取出水果糖的概率,等于0.75,那么求出P(E)就可以得到答案。根据全概率公式,
所以,
将数字代入原方程,得到
这表明,来自一号碗的概率是0.6。也就是说,取出水果糖之后,H1事件的可能性得到了增强。
六、【例子】假阳性问题
第二个例子是一个医学的常见问题,与现实生活关系紧密。
已知某种疾病的发病率是0.001,即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。现有一个病人的检验结果为阳性,请问他确实得病的可能性有多大, 假定A事件表示得病,那么P(A)为0.001。这就是"先验概率",即没有做试验之前,我们预计的发病率。再假定B事件表示阳性,那么要计算的就是P(A|B)。这就是"后验概率",即做了试验以后,对发病率的估计。
根据条件概率公式,
用全概率公式改写分母,
将数字代入,
我们得到了一个惊人的结果,P(A|B)约等于0.019。也就是说,即使检验呈现阳性,病人得病的概率,也只是从0.1%增加到了2%左右。这就是所谓的"假阳性",即阳性结果完全不足以说明病人得病。
为什么会这样,为什么这种检验的准确率高达99%,但是可信度却不到2%,答案是与它的误报率太高有关。(【习题】如果误报率从5%降为1%,请问病人得病的概率会变成多少,)
有兴趣的朋友,还可以算一下"假阴性"问题,即检验结果为阴性,但是病人确实得病的概率有多大。然后问自己,"假阳性"和"假阴性",哪一个才是医学检验的主要风险,
范文五:贝叶斯的例子
一、什么是贝叶斯推断
贝叶斯推断()是一种统计学方法,用来估计统计量的某种性质。
它是贝叶斯定理()的应用。英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。
贝叶斯推断与其他统计学推断方法截然不同。它建立在主观判断的基础上,也就是说,你可以不需要客观证据,先估计一个值,然后根据实际结果不断修正。正是因为它的主观性太强,曾经遭到许多统计学家的诟病。
贝叶斯推断需要大量的计算,因此历史上很长一段时间,无法得到广泛应用。只有计算机诞生以后,它才获得真正的重视。人们发现,许多统计量是无法事先进行客观判断的,而互联网时代出现的大型数据集,再加上高速运算能力,为验证
这些统计量提供了方便,也为应用贝叶斯推断创造了条件,它的威力正在日益显现。
二、贝叶斯定理
要理解贝叶斯推断,必须先理解贝叶斯定理。后者实际上就是计算"条件概率"的公式。
所谓"条件概率"(Conditional probability),就是指在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。
根据文氏图,可以很清楚地看到在事件B发生的情况下,事件A发生的概率就是P(A∩B)除以P(B)。
因此,
同理可得,
所以,
即
这就是条件概率的计算公式。
三、全概率公式
由于后面要用到,所以除了条件概率以外,这里还要推导全概率公式。 假定样本空间S,是两个事件A与A'的和。
上图中,红色部分是事件A
,绿色部分是事件A'
,它们共同构成了样本空间S。 在这种情况下,事件B可以划分成两个部分。
即
在上一节的推导当中,我们已知
所以,
这就是全概率公式。它的含义是,如果
A和A'构成样本空间的一个划分,那么事件B的概率,就等于A和A'的概率分别乘以B对这两个事件的条件概率之和。 将这个公式代入上一节的条件概率公式,就得到了条件概率的另一种写法:
四、贝叶斯推断的含义
对条件概率公式进行变形,可以得到如下形式:
我们把P(A)称为"先验概率"(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。P(B|A)/P(B)称为"可能性函数"(Likelyhood),这是一个调整因子,使得预估概率更接近真实概率。
所以,条件概率可以理解成下面的式子:
后验概率 = 先验概率 x 调整因子
这就是贝叶斯推断的含义。我们先预估一个"先验概率",然后加入实验结果,看这个实验到底是增强还是削弱了"先验概率",由此得到更接近事实的"后验概率"。 在这里,如果"可能性函数"P(B|A)/P(B)>1,意味着"先验概率"被增强,事件A的发生的可能性变大;如果"可能性函数"=1,意味着B事件无助于判断事件A的可能性;如果"可能性函数"
五、【例子】水果糖问题
为了加深对贝叶斯推断的理解,我们看两个例子。
第一个例子。两个一模一样的碗,一号碗有30颗水果糖和10颗巧克力糖,二号碗有水果糖和巧克力糖各20颗。现在随机选择一个碗,从中摸出一颗糖,发现是水果糖。请问这颗水果糖来自一号碗的概率有多大?
我们假定,H1表示一号碗,H2表示二号碗。由于这两个碗是一样的,所以P(H1)=P(H2),也就是说,在取出水果糖之前,这两个碗被选中的概率相同。因此,P(H1)=0.5,我们把这个概率就叫做"先验概率",即没有做实验之前,来自一号碗的概率是0.5。
再假定,E表示水果糖,所以问题就变成了在已知E
的情况下,来自一号碗的概
率有多大,即求P(H1|E)
。我们把这个概率叫做"
后验概率",即在E事件发生之后,对P(H1)的修正。
根据条件概率公式,得到
已知,P(H1)等于0.5,P(E|H1)为一号碗中取出水果糖的概率,等于0.75,那么求出P(E)就可以得到答案。根据全概率公式,
所以,
将数字代入原方程,得到
这表明,来自一号碗的概率是0.6。也就是说,取出水果糖之后,H1事件的可能性得到了增强。
六、【例子】假阳性问题 第二个例子是一个医学的常见问题,与现实生活关系紧密。
已知某种疾病的发病率是0.001,即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。现有一个病人的检验结果为阳性,请问他确实得病的可能性有多大? 假定A事件表示得病,那么P(A)为0.001。这就是"先验概率",即没有做试验之前,我们预计的发病率。再假定B事件表示阳性,那么要计算的就是P(A|B)。这就是"后验概率",即做了试验以后,对发病率的估计。
根据条件概率公式,
用全概率公式改写分母,
将数字代入,
我们得到了一个惊人的结果,P(A|B)约等于0.019。也就是说,即使检验呈现阳性,病人得病的概率,也只是从0.1%增加到了2%左右。这就是所谓的"假阳性",即阳性结果完全不足以说明病人得病。
为什么会这样?为什么这种检验的准确率高达99%,但是可信度却不到2%?答案是与它的误报率太高有关。(【习题】如果误报率从5%降为1%,请问病人得病的概率会变成多少?)
有兴趣的朋友,还可以算一下"假阴性"问题,即检验结果为阴性,但是病人确实得病的概率有多大。然后问自己,"假阳性"和"假阴性",哪一个才是医学检验的主要风险?
转载请注明出处范文大全网 » 贝叶斯公式的应用论文