范文一:条件期望
条 件 数 学 期 望
我们曾经引进条件分布函数的概念,现在介绍条件数学期望的概念。
为了方便起见,我们讨论两个随机变量ξ与η的场合,假定它们具有密度函数p(x,y),并以p(y|x)记已知ξ=x的条件下,η的条件密度函数,以p1(x)记ξ的密度函数。
定义 在ξ=x的条件下,η的条件数学期望定义为
E{η|ξ=x}=?yp(y|x)dy
-∞∞
例 : 某射击手进行射击,每次射击击中目标的概率为P(0<><1),射击进行到击中目标两次时停止.令ξ表示每一次击中目标时的射击次数, η表示每二次击中目标时的射击次数,试求联合分布列pij,条件分布列pi|j,pj|i及数学期望e{ξ|η="">1),射击进行到击中目标两次时停止.令ξ表示每一次击中目标时的射击次数,>
解 据题意知
pij=p(ξ=i,η=j)
=p2qi-2,1≤i<>
其中q=1-p,又
pi?=
j=i+1
∑pij=
∞
j=i+1
2j-2
p∑q
∞
p2qi-1
==pqi-1,i=1,2, 1-qp?j=∑pij=∑p2qj-2
i=1
i=1
j-1
j-1
(j-1)p2qj-2,j=2,3
于是条件分布列为
p2qj-21
pi|j===,1≤i
p?j(j-1)pqj-1p2qj-2j-i-1
pj|i===pq,j>i,i=1,2 i-1
pi?pq
pij
pij
这时
E{ξ|η=n}=∑ipi|n
i=1n-1
=∑i?
i=1
n-1
1n
=n-12
在这个例子中,条件期望E{ξ|η=n}的意义都很直观的。如果已知第二次击中发生在第n次射击,那么第一次击中可能发生在第1, ,n-1
11,因为pi|n=,也就是说已n-1n-1
n
知η=n的条件下,ξ取值为1, ,n-1是等可能的,从而它的均值为.
2
次,并且发生在第i次的概率都是
条件期望具有与普通数学期望相类似的性质,例如有 (1)
若a≤ξ≤b则E{ξ|η=bj}存在,具有a≤E{ξ|η=bj}≤b;特别,当C是常数时, E{ξ|η=bj}=C; (2)
若k1,k2是两个常数,又E{ξ1|η=bj},E{ξ2|η=bj}存在,则
E{k1ξ1+k2ξ2|η=bj}
=k1E{ξ1|η=bj}+k2E{ξ2|η=bj}
这是在固定η=bj的条件下考察条件期望性质,由条件期望的定义可知,当给定ξ时,对于η的每一个可能的取值bj(j=1,2 )就有一个确定的实数E{ξ|η=bj}与之对应.因而E{ξ|η=bj}是η单值函数,当η=bj时,这个函数的值就等于E{ξ|η=bj},
E({ξ|η})=∑E{ξ|η=bj}p(η=bj)
j=1∞
而
E{ξ|η=bj}=∑aipi|j=∑ai
i=1
i=1
∞
∞
pijp?j
把它代入前面的式子中,即可得到
E(E{ξ|η})=∑∑ai
j=1i=1
∞
∞∞
pijp?j
p?j=∑ai∑pij
i=1
j=1
∞∞
=∑aipi?=Eξ
i=1
由此可见,随机变量ξ对η求条件期望后再求期望,等于对这个随机变量直接求期望.这是条件期望的一个重要的基本性质. 下面在随机变量是连续情况下也略作证明: 因为 E(η)=?-∞yp2(y)dy
=?y?p(x,y)dxdy
-∞
-∞∞
∞
∞
∞
=?
∞
-∞-∞∞
?
yp(x,y)dxdy
而 E(η|ξ)=?-∞yp(y|x)dy
=?y
-∞∞
p(x,y)
dy p1xy
p(x,y)
p1(x)dx p1xE{E(η|ξ)}=?
∞
-∞-∞∞
∞
?
∞
=?-∞?-∞yp(x,y)dxdy 证毕。
我们用Poisson-Gamma来验证理论结果,假设x服从gamma(a,b)分布在Matlab中依gamma产生的随机数的期望为ab,设y服从poisson(x)分布在matlab中依poisson产生的随机数的期望为x,我们产生这样的序列,x Gamma(a,b),y Poisson(x),xy互相独立。理论上计算可得E(y)=ab,以下列出matlab程序,通过运行验证可得
与理论结果仅是百分位上有一点差别,这是序列长和随机性有关。 clc;
m=10000;%随机数序列长 a=2; b=3; for i=1:m
x(i)=gamrnd(a,b,1,1); %产生Gamma随机数
y(i)=poissrnd(x(i),1,1);%以lambda为期望产生Poisson随机数 end
Ey=mean(y) %求y的期望
error=Ey-a*b %求实际y的期望与理论期望的误差 条件数学期望在预测问题中起重要作用,我们要找ξ与η的函数关系,设有关系y=h(x),利用最小二乘法,使
E??η-h(ξ)??
2
达到最小。
因为E??η-h(ξ)??=?-∞?-∞??y-h(x)??p(x,y)dxdy
=?p1(x)
-∞∞
2∞∞
2
{
?y-h(x)??p(y|x)dydx ?-∞?
∞
2
∞2
}
当h(x)=E(η|ξ=x)时,
2
)??y-h(x??-∞?
(p|y)x达dy到最小,从而使
E??η-h(ξ)??达到最小。我们称y=E{η|ξ=x}是η关于ξ的回归。
参考文献:
1、复旦大学,概率论与数理统计 1980
2、苏金明等 matlab工具箱应用 电子工业出版社
范文二:条件期望
第二节 条件期望、矩母函数
1.2.1 条件期望
(1) 事件A , B ,p (B )>0,p A B =
()}
p (A , B ) p B (2) r . v . (X , Y ), p Y =y X =x =
{
p (X =x , Y =y ) p X =x x
条件分布:F Y
X
(y x )=p {Y £y X =x }=ò(x y )=f (x , y )
f X x D
-¥
f Y x (y x )dy =ò
x
-¥
f (x , y ) f X x 条件密度:f Y
X
p Y ?A X =x =(3) 条件期望:E Y X =x =
(
)ò
A
f Y X (y x )dy
D
(
)òyf (y x )dy =m (x )
Y X
例1.8扔一硬币出现正面的概率为p ,独立地作投币试验。记S 为n 次试验中出现正面的总次数,并设首次出现正面是在第T 次试验。问题是求给定n 次试验中仅出现了一次正面时随机变量T 的条件概率分布,也即p T =k S =1。 解: p T =k S =1=p (1-p ) n -1
1
p {S =1}=C n p (1-p ) n -1
()
()
p (T =k , S =1)p (1-p ) n -11p (T =k S =1)==1=
p S =1C n p (1-p ) n -1n
条件期望有些重要的性质:
命题1.1 a) 若X 与Y 独立,则E X Y =y =EX
()
òE (X =y )dF (y )=E [E (X Y )]
c) 对随机变量X , Y 的函数f(X , Y )恒有:E [f(X , Y Y =y ]=E [f(X , y Y =y ]
b) 条件期望有所谓平滑性: EX =
Y
1.2.2 矩母函数及生成函数
定义1.6 随机变量X 的矩母函数定义为随机变量e 的期望记作g (t ),即
tX
g (t )=E (e tX )=òe tx dF (x )
例1.9 随机和的矩母函。记X 1, X 2, L 为一串独立同分布的随机变量,N 为非负整数值随机
变量且与X 序列相独立。Y 为随机和解:
?X
i =1
N
i
。求Y 的矩母函数。
éìN ùü
E e N =n =E êexp ít ?X i yN =n ú
??i =1t?
[
tY
]
éìn ùü
=E êexp ít ?X i yN =n ú
??i =1t?éìn üùn =E êexp ít ?X i yú=[g X (t )]??i =1t?
则:g Y (t )=E (exp {tY })=E E exp {tY N =E (g X (t ))
{[]}
[
N
]
定义1.7 若X 为离散随机变量,则期望E s X 为其概率生成函数,记作fX (s )。特别若
()
p (X =k )=p k , k =0, 1, 2, L , 则fX (s )=?p k s k
k =0
¥
1.3 收敛性
定义1.8 设X n , n 31是一列随机变量,若存在随机变量X ,使对"?>0,有 lim p X n -X 3?=0
n ?¥
()
则称随机变量序列{X n , n 31}以概率收敛于X ,记为X n ?X
例1.10 在Benoulli 试验中,设每次试验成功的概率为p ,若以S n 记n 次试验中成功的次数,则S n /n ?p 。
证明: 由于S n ~B (n , p ),故由Markov 不等式,对"e>0有:
p
p
?S n ?E (S n -np )÷p ?-p 3e=p (S -np 3n e)£n ?n ÷n 2e2è? np (1-p )p (1-p )==?0(n ?¥)n 2e2n e2
2
所以S n /n ?p
定义1.9 设随机变量X 和X n ,n 31都有有限的二阶矩,如果lim E (X n -X )=0
2
n ?¥
p
则称X n 均方收敛于X ,记为X n ?X 。
L 2
定义1.10 F n (x )(n =1, 2, L ), F (x )均为分布函数,若lim F n (x )=F (x )对每个F (x )的连续点
n ?¥
成立,则称F n (x )弱收敛于F (x ),记为F n (x )?F (x )。 定义1.11 若随机变量序列{X n }
W
(n =1, 2, L )的分布函数列F n (x )(n =1, 2, L )弱收敛于X
F (x )d
的分布函数,则称X n 依分布收敛于X ,记为X n ?X
定义1.12 {X n }(n =1, 2, L )为随机变量序列,若事件{w :lim n ?¥
X n =X }
的概率为1,即
p {l n im ?¥
X n =X }
=1
则称X n 几乎处处收敛于X (也称为依概率1收敛到X ),记为X n ?X a . s .
以上四种收敛性有如下关系: 几乎处处收敛
依概率依分布收敛
均方收敛
范文三:条件期望的性质及应用
华 北 水 利 水 电 学 院
讨论条件期望的性质及应用
课 程 名 称: 概率论与数理统计 专 业 班 级: 测控技术与仪器2010080班 成 员 组 成: 姓名 孙鹏辉 学号 201008008
姓名 张亚平 学号 201008010
姓名 张付军 学号 201008011
姓名 张杰勇 学号 201008014
联 系 方 式: 13939004311
2012年 5月9 日
摘要:从条件期望的定义入手,讨论了条件期望的性质及其应用,并
列举了条件期望在最优预测中的一些应用实例。
关键词:条件数学期望;最优预测;随机变量
英文题目
Discuss the nature of conditional expectation and application
Abstract: From the definition of conditional expectation, discussed the condition the expectations of the nature and the application, and lists the conditions in the optimal forecasting expected some of the application example.
Key words:Conditions mathematical expectation; The optimal forecasting; Random
variables
1 引言 近年来,随着社会上人们对随机现象的不断观察和研究,条件数学期望已经被广泛的利用到日常生活中。随着研究的深入,条件数学期望在计算科学、生物、统计、物理、工程、运筹、经济管理和金融领域中得到广泛应用,并取得了很好的效果。尤其值得注意的是条件期望在最优预测中的应用。现代概率论总是从讲述条件期望开始,这是因为以测度论为基础的条件期望是鞅论的基础,也是严格陈述现代概率论必不可少的基本概念。 2 研究问题及成果
2.1 条件期望的性质
2.2 条件期望的主要应用
2.3 基于条件期望的最优预测
3 结束语 在当前的社会环境下,经济发展是重要问题。通过条件期望可以预测小至一个公司的日常运作,大至世界经济的未来发展方向,并且可以根据它所做出的预测做出相应的决策。所以,条件期望的经济应用将会越来越为人们所关注。
参考文献
[1] 盛骤等. 概率论与数理统计[M].北京:高等教育出版社,2009.
分工情况
第一部分由孙鹏辉完成
第二部分由张亚平完成
第三部分由张杰勇、张付军完成
论条件期望的性质及应用
,pxy,为了方便起见,我们讨论两个随机变量与,的场合,假定它们具有密度函数,,,
pxpyx|,,,x,并以记已知的条件下,的条件密度函数,以记的密度函数。 ,,,,1
,,,x,Exypyxdy,,||,,定义 在的条件下,的条件数学期望定义为 ,,,,,,,例 : 某射击手进行射击,每次射击击中目标的概率为P(0<><>
,表示每一次击中目标时的射击次数, ,表示每二次击中目标时的射击次数,试次时停止.令
pp,pE{,|,,j}求联合分布列,条件分布列及数学期望 iji|jj|i
解 据题意知
p,p(,,i,,,j) ij
2i,2,pq,1,i,j,2,3,?
其中q=1-p,又
,,2j2, p,p,pqi,ij,,ji1ji1,,,,
2i,1pqi,1 ,,pq,i,1,2,?1,q
j,1j,12j,2 p,p,pq,,,jiji,1i,1
2j,2(j,1)pq,j,2,3?
于是条件分布列为
2j,2ppq1ij p,,,,1,i,j,2,3?i|j2j,2pj,1(j,1)pq,j
2j,2ppqijj,i,1 p,,,pq,j,i,i,1,2?j|ii,1ppqi,
这时
n,1
E{,|,,n},ip ,i|ni,1
n,11n,,, i,12,ni,1
?.条件期望具有与普通数学期望相类似的性质,例如有
E{,|,,b}a,,,bE{,|,,b}(1) 若则存在,具有a??b;特别,当C是常数jj
E{,|,,b}时, =C; j
k,kE{,|,,b}E{,|,,b}(2) 若是两个常数,又,存在,则121j2j
E{k,,k,|,,b} 1122j
,kE{,|,,b},kE{,|,,b} 11j22j
,,b,这是在固定的条件下考察条件期望性质,由条件期望的定义可知,当给定时,对于j
b(j,1,2?)E{,|,,b},的每一个可能的取值就有一个确定的实数与之对应.因而jj
,,bE{,|,,b}E{,|,,b},是单值函数,当时,这个函数的值就等于, jjj
,
E({,|,}),E{,|,,b}p(,,b),jjj1,
而
,,pijEbapa {,|,,},,,,jii|jipii11,,j,
把它代入前面的式子中,即可得到
,,,,pij E(E{,|,}),ap,ap,,,,ijiij,pji11i1j1,,,,j,
,
,ap,E,,ii,i,1
,,对求条件期望后再求期望,等于对这个随机变量直接求期望.这是条由此可见,随机变量
件期望的一个重要的基本性质. 下面在随机变量是连续情况下也略作证明:
,因为 Eypydy,,,,,,2,,,
,, ,ypxydxdy,,,,,,,,,
,, ,ypxydxdy,,,,,,,,,
,Eypyxdy,,||,而 ,,,,,,,
,pxy,,, ,ydy,,,px,,1
,,pxy,,, ,,,EEydypxdx|,,,,,,1,,,,,,px,,1
,, 证毕。 ,ypxydxdy,,,,,,,,,
,,条件数学期望在预测问题中起重要作用,我们要找与的函数关系,设有关系
2Eh,,,,,yhx,,利用最小二乘法,使达到最小。 ,,,,,,
2,,2Ehyhxpxydxdy,,,,,,,,,,因为 ,,,,,,,,,,,,,,,,
,,2 ,,pxyhxpyxdydx,,|,,,,,,1,,,,,,,,,,
,22Eh,,,,,hxEx,,,,|,,yhxpyxdy,|当时,达到最小,从而使达,,,,,,,,,,,,,,,,,
yEx,,,,|,,到最小。我们称是关于的回归。 ,,
,,,,X,YX,Y?.条件数学期望主要应用于二维随机变量。在为二维离散随机变量场合
E,,X,E,,XY,y,xPX,xY,,,y下,其计算公式为: ,iii
,,,,,,EY,EYX,x,yPY,yX,x 或 ,jjj
,,X,Y例6 设二维离散随机变量的联合分布列为
Y
0 1 2 3 X
0 0 0.01 0.01 0.01
1 0.01 0.02 0.03 0.02
2 0.03 0.04 0.05 0.04
3 0.05 0.05 0.05 0.06
4 0.07 0.06 0.05 0.06
5 0.09 0.08 0.06 0.05
,,,,EXY,2EYX,0试求和
,,,,EXY,2PXY,2,首先得求 解 要求
0.011?PX,0Y,2,, ,,0.01,0.03,0.05,0.05,0.05,0.0625
355同理可得PX,1Y,2, PX,2Y,2, PX,3Y,2, ,,,,,,252525
56PX,4Y,2, PX,5Y,2, ,,,,2525
535556782202345 ,,,,?EXY,xPX,xY,,,,,,,,,,,,,ii252525252525i,0
,,EYX,0,2 用同样的方法,我们可得
在连续型随机变量场合下,条件数学期望同样适用,其计算公式为
,,,,,,EXY,y,xpxydx ,,,
,,X,Y例13 设二维随机变量的联合密度函数为
x,y, 0,x,y,1, px,y, ,,,0, 其他,
,,0,y,1时,求EXY,y试在(
解 由题意知,
12,,,,,,px,241,xydx,12yy,2y,1Y,y
,,px,y1,x,,?pxy,,11,,py2Yy,y,22
1,,,,当,,时, 0y1 EXY,y,xpxydx,y
112,, ,x,xdx,y112y,y,22
231,,1xx,, ,,,,11y232,,y,y,22
23,,11yy,,,,,,,116232,,y,y, 22
221121,,,,y,y,y,,,23,,61y,
?.基于条件期望的最优预测
条件期望是现代概率体系中的一个重要概念,在实际生活中许多问题都可以利用它解决,在概率论的理论与应用上也起着重要的作用。直接的理论应用,根据条件期望的性质我们可以利用条件期望求随机变量的期望和方差。在保险业中就有很多利用条件期望求随机变量方差的例子。在实际生活中,只要你仔细观察,你就会发现条件期望的应用还是比较广泛。
有时我们会遇到联合分布随机向量的各分量之间的预测问题。比如,人的身高ξ与体重η,在网上有一个流行的公式是η=ξ-110,其中ξ以厘米为单位,而η以公斤为单位,可以拿它作为用身高预测体重的公式,但是为了评价这个预测公式的好坏,就要提出一个标准,以“均方误差最小”作为目标,即若得到R.VY的观察值,根据这些观察值试图预测另一个R.VY的取值,令g(Y)表示这个预测,即若Y的观察值等于y,那么g(y)就是对R.VX的预测值,即选择一个函数g,使g(Y)尽可能接近X,选择函数g的一种准则就是使E[x-g(Y)2]的取值达到最小,我们可以证明在这种准则下,对Y的最优可能预测为g(Y)=E[X|Y]。
由于在最小预测误差方差意义下的最优预测值就是它的条件期望。条件期望在预测问题中有重要作用. 若X与Y是相依的随机变量,如何找出X与Y的函数关系,下面命题说明在均方意义下,在已知随机变量X 的条件下, E(Y|X)是Y的最佳预测。
命题:设X,Y是随机变量, g(x)是Borel函数,则E[(Y-g(X))2]?E(Y-E(Y|X))2] 证明: E[(Y-g(X))2|X]
= E(Y-E(Y|X)+E(Y|X)-g(X))2|X]
= E(Y-E(Y|X))2|X]+E(E(Y|X)-g(X))2|X]+2E[(Y-E(Y|X))(E(Y|X)-g(x))|X]
上面最后项中,因式E(Y|X)-g(X)当X取定值时是常数,所以
E[(Y-E(Y|X))(E(Y|X)-g(X))|X]=(E(Y|X)-g(X))?E[(Y-E(Y|X))|X]=0 故得 E[(Y-g(X))2|X]?E(Y-E(Y|X))2|X]。
由全数学期望公式得,两边取数学期望,就得到命题的证明。
通常当观察到X=x时, E[Y|X=x]是一切对Y的估计值中均方误差最小的一个,则称之为Y关于X的回归。
例 设身高为x (cm)的男子其成年儿子的身高服从均值为x+3 ,方差为10的正态分布,问身高为175cm的男子,其成年儿子的身高的最佳预测值是多少,
分析:令X表示父亲身高, Y表示儿子身高,则Y = X + 3 +ζ,其中,ζ, N (0 ,10) ,ζ与X 独立,由上面的结论可知, Y 的最佳预测是
E(Y|X=175)=E(X+3+ζ|X=175)
=175+3+ E(ζ|X=175)=178+Eζ=178(cm)
再如某大型商场的服装销售量已进入稳态期,因此,其月销量记录,可认为是一个宽平
所示: 稳随机序列。现有48个月的销售记录,其月平均销量为3 万件,统计数据如表1 表1 每月销量与平均销量之差
t y t y t y t y t y t y tttttt1 -3.79 9 -1.47 17 1.05 25 0.89 33 -0.65 41 2.30 2 -4.47 10 -1.56 18 2.52 26 1.90 34 1.34 42 3.51 3 -4.94 11 -0.55 19 2.40 27 1.40 35 -0.86 43 -1.49 4 -4.56 12 -1.82 20 0.39 28 1.01 36 -0.50 44 2.22 5 -2.16 13 -0.37 21 0.58 29 1.62 37 -1.10 45 2.43 6 -3.49 14 -0.37 22 0.92 30 1.41 38 -1.05 46 2.23 7 -3.27 15 -0.71 23 0.49 31 1.05 39 1.28 47 -0.82 8 -2.63 16 0.11 24 1.32 32 1.15 40 1.94 48 -0.24
试对表1 的数据建立模型和进行预测。首先估算样本序列的标准自相关函数和偏相关函数。此序列是AR(2)模型。其模型方程是y,φy+φy+a,对参数φ,φ用最小二乘t1t-12t-2t12估计可得:φ+0.9φ,0.9,0.9φ+φ=0.84。 1212
解此方程可得:φ,0.7538,φ,0.158, 可得: 12
一步预测方程:y(1),0.7538y+0.158y-1, ttt
二步预测方程:y (2)=0.7538y (1)+0.158y, ttt
三步预测方程:y(3),0.7538y (2)+0.158y(1)。 ttt
对上述预测公式以t=47 进行一步、二步、三步预测,并与实测数据对比。为对上述预
2测做出区间估计,根据矩估计可估算出σ的估计值: a
2σ,r(1-φρ-φρ)。 a01122
2计算得到r=4.0372,σ,4.0372(1-0.7538×0.9-0.158×0.84),0.7625,从而 0a
σ,0.8732。此外又根据模型的传递形式,可算出y(1)、y(2)、y(3)的95%置信α474747预测区间分别为:(-2.7164,0.7764)、(-3.047,1.327)、(-3.3282,1.7282)。
可以看出,通过“均方误差最小”时为最优预测可以解决一系列的预测问题。在当前的社会环境下,经济发展是重要问题。通过条件期望可以预测小至一个公司的日常运作,大至世界经济的未来发展方向,并且可以根据它所做出的预测做出相应的决策。所以,条件期望的经济应用将会越来越为人们所关注。
范文四:条件期望的性质与应用
条件期望的性质和应用
摘要:条件数学期望(以下简称条件期望)是随机分析理论中十分重要的概念,在理论实际上都有很重要的应用。本文首先分析了条件期望的几种定义和性质,进而研究了条件期望的求法,最后举例分析条件期望在实际问题中的应用。 关键词:条件期望;定义;性质;应用
条件期望是现代概率体系中的一个重要概念。近年来,随着人们对随机现象的不断观察和研究,条件期望已经被广泛的利用到日常生活中,尤其值得注意的是条件期望在最优预测中的应用。现代概率论总是从讲述条件期望开始的。鉴于此,在分析条件期望的几种定义时,通过比较它们的优缺点,使初学者在充分认识条件期望的基础上,由非条件期望的性质学习顺利过渡到条件期望性质的学习,实现知识的迁移。通过研究条件期望的求法,从而提高计算能力与解题技巧。条件期望不仅在数学上有重要的价值与意义,还在生物、统计、运筹和经济管理等方面有着重要的作用与贡献。总之,研究条件期望的性质和应用不仅有助于学生对数学的学习,而且还有利于进一步探索科学的其它领域。 1 条件期望的几种定义
1.1 条件分布角度出发的条件期望定义
从条件分布的角度出发,条件分布的数学期望称为条件期望。
由离散随机变量和连续随机变量条件分布的定义,引出条件期望的定义。 定义1 离散随机变量的条件期望
设二维离散随机变量(X,Y)的联合分布列为pij=P(X=xi,Y=yj),
i=1,2,???,j=1,2,???.,对一切使P(Y=yj)=p?j=∑pij>0的yj,称
i=1+∞
pi|j=P(X=xiY=yj)=
P(X=xi,Y=yj)PY=yj=
pijp?j
,i=1,2,???
为给定Y=yj条件下X的条件分布列。
此时条件分布函数为 Fxyj=∑P(X=xiY=yj)=∑pij;
xi≤x
xi≤x
()
同理,对一切使P(X=xi)=pi?=∑pij>0的xi,称
j=1
+∞
pj|i=P(Y=yjX=xi)=
P(X=xi,Y=yj)PX=xj=
pijpi?
,j=1,2,???
为给定X=xi条件下Y的条件分布列。
此时条件分布函数为 F(yxi)=
yj≤y
∑P(Y=y
j
X=xi)=
yj≤y
∑p
j。
故条件分布的数学期望(若存在)称为条件期望,定义如下
E(XY=y)=∑xiP(X=xiY=y)或E(YX=x)=∑yjP(Y=yjX=x)。
i
j
定义2 连续随机变量的条件期望
设二维连续随机变量(X,Y)的联合密度函数为p(x,y),边际密度函数为
pX(x)和pY(y)。
对一切使pY(y)>0的y,给定Y=y条件下X的条件分布函数和条件密度函数 分别为F(xy)=?
x
-∞
p(x,y)p(u,y)
,p(xy)=; pY(y)pYy 同理对一切使pX(x)>0的x,给定X=x条件下Y的条件分布函数和条件密度 函数分别为F(yx)=?
y
-∞
p(x,y)p(x,v)
dv,p(yx)=。 pX(x)pXx+∞
故条件分布的数学期望(若存在)称为条件期望,定义如下
E(XY=y)=?
+∞
-∞
xp(xy)dx或E(YX=x)=?
-∞
yp(yx)dy。
1.2 测度论角度出发的条件期望定义
借助测度论这一数学工具,给出了随机变量在给定子δ代数下条件期望的一 般性定义——公理化定义,通过讨论,还可同时发现它的两条等价性定义。 引理1 若X是可积(或积分存在)随机变量,则必存在惟一的(不计几乎处处相等的差别)可积(相应地,积分存在)的G可测随机变量Y,它满足
?YdP=?
A
A
XdP,?A∈G (1)
定义3(公理化定义) 设X是概率空间(Ω,F,P)上的可积(或积分存在)随机 变量,G是F的子σ代数,则X关于G的条件期望E(XG)是满足以下两条件的随机变量:
(i) E(XG)是G可测的;
(ii) ?E(XG)dP=?XdP,?A∈G。
A
A
特别地,当G=σ(Y)时,也称E(XG)为X关于随机变量Y的条件期望,记 为E(XY)。
由引理1,条件期望E(XG)=
dv
就是由(1)式定义的符号测度v关于P的 dP
Radon导数。
由定义 3看出,条件期望是通过积分等式(1)确定的,根据积分性质易知,两个几乎处处相等的函数的积分是相等的。 因此,条件期望的确定以及许多有关条件期望的论断都是不计几乎处处相等的差别的,从而涉及的关系式都是几乎处处相等意义下的。
由上面的讨论,我们有如下的等价定义:
G是F的定义4 设X是概率空间(Ω,F,P)上的可积(或积分存在)随机变量,
子σ代数,则X关于G的条件期望Y是满足以下两条件的随机变量
(i)Y是G可测的;
(ii)?YdP=?XdP,?A∈G。
A
A
定义5 设X是概率空间(Ω,F,P)上的可积(或积分存在)随机变量,G是F 的子σ代数,则X关于G的条件期望E(XG)是满足以下两条件的随机变量:
(i)E(XG)是G可测的;
(ii)E??E(XG)IA??=E[XIA],?A∈G。
上述三个定义虽然表达式有所不同,但其本质是相同的,且都是以公理化的 形式给出的,显得比较抽象,增加了定义的理解难度。 1.3 几何角度出发的条件期望定义
从几何的角度,利用投影定理这一数学工具,给出条件期望的几何定义。 引理2(投影定理) 如果M是Hilbert空间H的一个闭线性子空间,且x∈H,那么
=infx-y, (i) 存在惟一元素x∈M,使得x-x
y∈M
^
∈M且x-x ∈M,x-x ∈M⊥,其 =infx-y成立的充分必要条件是x(ii)x
y∈M
为x在M上的正交投中?是Hilbert空间上的范数, M⊥是M的正交补。 称x
影,记为PMx。
实Hilbert空间L2(Ω,F,P)内积定义为X,Y=E(XY)。
引理3 记LP(F):LP(Ω,F,μ); LP(G):LP(Ω,G,μ), 则LP(G)是LP(F)的子空
间。
于是,特别地, L2(G)是L2(F)的闭子空间。
22
定义6(几何定义) 以L2(Ω,F,P)∈X→E??XG??∈L(Ω,G,P)表示L(Ω,F,P)
到L2(Ω,G,P)中的正交投影, 则任给X∈L2(Ω,F,P),E??XG??称为给定G时X的条件期望。 2 条件期望的性质 2.1 一般性质
因为条件数学期望是数学期望的一种特殊形式,所以它具有一般的非条件数 学期望的所有性质。
性质1 若c是常数,则E(c)=c; 性质2 对任意常数a,有E(aX)=aE(X); 性质3 对任意的两个函数g1(x)和g2(x),有
E[g1(X)±g2(X)]=E[g1(X)]±E[g2(X)];
性质4 若X、Y相互独立,则E(X?Y)=E(X)?E(Y)。
根据此定理,运用归纳法,易得下列推论:
推论 1 E(a1X1+a2X2+???+anXn+b)=a1E(X1)+a2E(X2)+???+anE(Xn)+b,
其中a1,a2,???,an,b均是常数时,特别有
E(X1+X2+???+Xn)=E(X1)+E(X2)+???+E(Xn)。
推论 2 若X1,X2,???,Xn相互独立,则
E(X1?X2?...?Xn)=E(X1)?E(X2)?...?E(Xn)。
注意:对于“和” ,不要求X1,X2,???,Xn相互独立,对于“积” ,则要求
X1,X2,???,Xn相互独立。 2.2 特殊性质
从条件期望的这几种定义出发还可得到以下性质。
性质1 E(a1X1+a2X2G)=a1E(X1G)+a2E(X2G),其中a1,a2∈R,且假定
E(a1X1+a2X2G)存在;
证明:根据条件期望的定义 5 ,由于E(X1G),E(X2G)都G可测,所以
a1E(X1G)+a2E(X2G)也G 可测;
其次,令G'=A∈GE[XiIA]<>
?A∈G',E??E(XiG)IA??=E[XiIA](i=1,2),
?=E?所以 E??(a1X1+a2X2)IA??,?A∈G' ?(a1E(X1G)+a2E(X2G))IA?
{}
这表明a1E(X1G)+a2E(X2G)是a1X1+a2X2关于G的条件期望,从而证得
E(a1X1+a2X2G)=a1E(X1G)+a2E(X2G)。
性质2 如果X,Y关于G为σ-可积时,如果X≥Y(a.s.),则E(XG)≥E(YG)
(a.s.);
证明:令A=[E(XG)<>
1
],则A= Am。 mm
由于X,Y关于G为σ-可积,所以 ?Ωn∈G,Ωn↑Ω,EXIΩn<∞,>∞,><>
0≥-
11
P(An)=-EIAn≥E?E(XG)-E(YG))IAm? (??mm
()
()
()
≥E??(E(XG)-E(YG))IAm?Ωn?? =E??E(X-YG)IAm?Ωn?? =E??(X-Y)IAm?Ωn??≥0
于是P(An)=0,从而P(A)=0。这表明
E(XG)≥E(YG) (a.s.)
性质3 如果X关于G为σ-可积时,E(XG)≥E(XG) (a.s.);
证明:因为X,-X关于G为也σ-可积,且X≥X,X≥-X,所以由条件 期望的特殊性质2可知, E(XG)≥E(XG) (a.s.),
E(XG)≥E(-XG) (a.s.)
又由条件期望的特殊性质1可知, E(-XG)=-E(XG) (a.s.) 所以, E(XG)≥E(XG) (a.s.)。
性质4 (全数学期望公式)E??E(XG)??=E(X);
证明:若(XG)为离散型的随机变量时,
?? E??E(XG)??=∑E?XG=bj?p(G=bj)
j
??
=∑?∑aip(X=aiG=bj)?p(G=bj)
j?i? =∑aip(X=ai,G=bj)
i,j
=E(X) 若(XG)为连续型的随机变量时,
E??E(XG)??=?-∞E(XG=y)pG(y)dy =?[?
-∞+∞
+∞-∞+∞
xp(xy)dx]pG(y)dy
=? =?
+∞
-∞+∞
?
+∞
-∞+∞
xp(xy)pG(y)dxdy xp(x,y)dxdy
-∞
?
-∞
=?[?
-∞
+∞+∞
-∞
xp(x,y)dy]dx
=?
+∞
-∞
xpX(x)dx
=E(X) 性质5 如果X为G可测,则E(XG)=X;
证明:这是条件期望的定义5的显然推论。 特别当X=C(常数)时,E(CG)=C (a.s.)。 性质6 如果X与σ代数G独立,则E(XG)=E(X); 证明:设(X,G)是二维连续型随机变量,由独立性有
p(x,y)=pX(x)pG(y),
其中p(x,y),pX(x),pG(y)分别是(X,G)的密度函数和边际密度函数,这时条件密度函数pXG(x,y)=pX(x),于是当G=y时,
E(XG=y)=
+∞
-∞
?xp(xy)dx
X
+∞
=
-∞
?xp(x)dx=E(X),
X
上式对一切y成立,所以E(XG)=E(X)。
在此仅就连续型的情况进行证明,而离散型的可类似证明。 性质7 若关于G为σ-可积,Y为G可测且有限时,则
E(XYG)=YE(XG)(a.s.).
证明:为了证明E(XYG)有意义,首先须证XY关于G为σ-可积。 由于X关于G为σ-可积,所以?An∈G,An↑Ω,EXIAn<∞。由于y为g可测且有限,所以令bn=(y≤n)时bn∈g且bn↑ω。令ωn=an>∞。由于y为g可测且有限,所以令bn=(y≤n)时bn∈g且bn↑ω。令ωn=an>
()
Ωn↑Ω,并且
E(XYIΩ)≤nEYIAn<>
()
因此,XY关于G为σ-可积。
于是存在a.s.唯一的G可测随机变量E(XYG),使得
?A∈G',E??E(XYG)IA??=E(XYIA),
这里G'=A∈GE(XYIA)<>
E??E(XYG)IΩnIA??=EXYIΩnIA。
{}
()
又因E(XYG)IΩn为G可测,所以由上式知,E(XYG)IΩn是XYIΩn关于G的 条件期望。于是E(XYG)IΩn=EXYIΩnG (a.s.)
由于XYIΩn=XIΩnYIΩn,XYIΩn=XIΩnYIΩn,EXIΩn<>
()
()
E(XYIΩnG)=YIΩnE(XIΩnG) (a.s.)。
对于X,由于它关于G为σ-可积,所以同样可以得到 E(XG)IΩn=E(XIΩnG) (a.s.), 于是,YIΩnE(XIΩnG)=YIΩnE(XG) (a.s.)。
综上所证,得E(YXG)IΩn=YIΩnE(XG) (a.s.), 令n→∞,则由上式得E(XYG)=YE(XG) (a.s.)。
性质8 如果G1是σ代数G的子σ代数,则E??E(XG)G1??=E(XG1);
证明:显然,X关于G也σ-可积。为了证明E??E(XG)G1??有意义须证
E(XG)关于G1为σ-可积。
由于X关于G1为σ-可积,所以?Ωn∈G1,Ωn↑Ω,EXIΩn<>
E??E(XG)IA??=E(XIA),这里A∈A∈GE(XIA)<>
()
{}
以
?E??E(XG)IΩn?=E(XIΩn)<>
这表明E(XG)关于G1为σ-可积。
既然E(XIΩn)<>
E(XIΩnG1)=E?EXIΩnGG1? (a.s.)
??
()
因IΩn为G1可测,所以由条件期望的特殊性质7,
E(XG1)IΩn=E(XIΩnG1)=E?EXIΩnGG1?
??
=E??IΩnE(XG)G1??=E??E(XG)G1??IΩn (a.s.)
()
令n→∞,则由上式得E??E(XG)G1??=E(XG1) (a.s.)
引理4 随机变量X和Y的相关系数ρ(X,Y)在坐标平移变换中保持不变。 证明:设平移变换X=X1+a,Y=Y1+b,(a,b为常数) 由期望和方差的性质易知
ρ(X,Y)=
E[X-E(X)]?Y-E(Y)
?
=
E[X1+a-E(X1+a)]?Y1+b-E(Y1+b)
?E[X1-E(X1)]?Y1-E(Y1)
? =
=ρ(X1,Y1) 性质9 (增减性)设X和Y是随机变量,
(i)当E(YX=x)是x的减函数时,则ρ(X,Y)?0; (ii)当E(YX=x)是x的增函数时,则ρ(X,Y)?0; (iii)当E(YX=x)是常数时,则ρ(X,Y)=0。
证明:由引理知相关系数ρ(X,Y)在平移变换中保持不变,故不妨设
E(X)=E(Y)=0。
因为ρ(
X,Y)=号。
ρ(X,Y)的符号只决定于E(XY)的符
(i)若E(YX=x)是x的减函数,任取非零实数x1<>
如果 x1<0,有e(yx=x1)>E(YX=0) (2) 如果 x2>0,有E(YX=x2)
E(YX=x)≥E(YX=x1)>E(YX=0)
故也有xE(YX=x)<>
又当x>x1,即x1<>
x1<>
故也有xE(YX=x)≤xE(YX=0)。
使用Lebesgue-Stieltges积分表示则有
E(XY)=?
+∞
-∞
xE(YX=x)dFX(x)
+∞x1
=?xE(YX=x)dFX(x)+?xE(YX=x)dFX(x)
-∞x1
x1
<>
-∞
+∞
x1
xE(YX=0)dFX(x)
=E(YX=0)?
+∞
-∞
xdFX(x)
=E(YX=0)E(X)
=0
故ρ(X,Y)<>
当不等式(3)成立时,用类似的方法同样可证。 为节省篇幅,不再赘述。 (ii) 若E(YX=x)是x的增函数,任取非零实数x1<>
如果x1<> E(YX=x)≤E(YX=x1)<> 故也有 xE(YX=x)>xE(YX=0)。 又当x>x1,即x1<> x1<> 故也有xE(YX=x)≥xE(YX=0)。 使用Lebesgue-Stieltges积分表示则有 E(XY)=? +∞ -∞ xE(YX=x)dFX(x) +∞x1+∞ =?xE(YX=x)dFX(x)+? -∞x1 x1 xE(YX=x)dFX(x) xE(YX=0)dFX(x) >?xE(YX=0)dFX(x)+? -∞ x1 =E(YX=0)? +∞ -∞ xdFX(x) =E(YX=0)E(X) =0 故ρ(X,Y)>0 当不等式(5)成立时,用类似的方法同样可证。 (iii)当E(YX=x)=const=k E(XY)=? +∞ -∞ xE(YX=x)dFX(x) xdFX(x) =k? +∞ -∞ =kE(X) =0 故ρ(X,Y)=0。 综上所述,可知条件期望E(YX=x)关于变量x的增减性,决定了相关系数 ρ(X,Y)的符号。 3 条件期望的重要定理 定理1 (单调收敛定理) 若Xn↑Xa.s.,则在{E(X1G)>-∞}上,有 E(XG)=limE(XnG); n→∞ 证明:显然,Xn关于G为σ-可积。由条件期望的特殊性质2可知, 0≤E(XnG)↑(a.s.),所以a.s.存在limE(XnG)。 n→∞ 在极限不存在的ω∈Ω上补定义为0,这样就得倒一个G可测的随机变量 limE(XnG),令G'=A∈GE(XIA)<∞,>∞,> n→∞ {} E[limE(XnG)IA]=limE[E(XnG)IA] n→∞ n→∞ =limE(XIA) n→∞ =E[(limXn)IA] n→∞ =E(XIA) 这表明limE(XnG)是ξ关于G的条件期望,因而 n→∞ limE(XnG)=E(XG) n→∞ 定理2 (控制收敛定理) 若Xn≤Y,a.s,Y可积,且Xn→X,a.s或p,则 limE(Xn-XG)=0; n→∞ 证明:显然,Xn,X关于G为σ-可积。 令ζn+=supXn+k,ζn-=infXn+k,则 k≥0 k≥0 0≤Y-ζn+↑Y-X 且 0≤Y+ζn-↑Y+X (a.s.) 由条件期望的单调收敛定理可知 E(Y-ζn+G)↑E(Y-XG)且E(Y+ζn-G)↑E(Y+XG) (a.s.) 因而由条件期望的特殊性质1可知 E(ζn+G)↓E(XG) 且 E(ζn-G)↑E(XG) (a.s.) 又由条件期望的特殊性质2可知 E(ζn-G)≤E(XnG)≤E(ζn+G) (a.s.) 所以,E(XnG)→E(XG) (a.s.) 故 limE(Xn-XG)=0 n→∞ 定理3 (均方误差最小定理) 设Y是(Ω,F,P)上的任一随机变量,EY2<><> 22?? (6)??EY-Z≥EY-EYG ( )()?????? () 式中等号当且仅当Z=E(YG),a.s.时成立。 证明:因为EZ-E(YG)<> () E?Z-E(YG)Y-E(YG)G?=Z-E(YG)E?Y-E(YG)G?=0???? ()( ( )()() ) a.s. 222?????E(Y-Z)=EY-E(YG)+EZ-E(YG)?-2E?Y-E(YG)Z-E(YG)? ???????????? )()()() 22 =E?Y-E(YG)?+E?Z-E(YG)? ???????? 22 故得 E?(Y-Z)?≥E?Y-E(YG)? ?????? ()( () 2 这也证明了(6)式成立的充要条件是E?Z-E(YG)?=0, ???? () 即Z=E(YG) ,a.s. 说明:在最小二乘(均方)意义下,已知G的条件下,E(YG),a.s.是Y的 最佳预测。通常当观察到G={X=x}时,E(Yx)是一切对Y的估计值中均方误差最小的一个,则称之为Y关于X的回归。特别当X=(X1,???,Xn),G=σ(X)则在Rn→R的一切可测函数g中,在最小二乘意义下,E(YX1,???,Xn)是Y的最佳预测。 4 条件期望的求法 在现代概率论体系中,条件期望的概念只是一种理论上的工具,在其定义中没有包含算法,所以求条件期望概率往往很难,需要技巧。本文对几种不同情形下的条件期望的求法做出讨论。 方法一:利用问题本身所具有的某种对称性求解 例1 设X1,X2,???,Xn是独立同分布随机变量,EX1<> k=1n E(XkS),k=1,2,???,n。 解:首先证E(XiS)=E(XjS),i≠j。 E(XiS)关于σ(S)可测,E(XjS)关于σ(S)可测,为此只需证 ?A∈σ(S),?E(XiS)dp=?E(XjS)dp即可。 A A 由 ? A E(XiS)dp=?Xidp=?Xjdp=?E(XjS)dp, A A A 可知i≠j 时,E(XiS)=E(XjS)几乎处处成立。 从而E(X1+X2+???+XnS)=nE(XkS)=S,即 E(XkS)= S ,a.s.k=1,2,???,n。 n 方法二:利用线性变换将随机变量分解为关于作为条件的σ域可测或独立的随机变量之和, 利用条件期望的性质求和。 例 2 设有正态样本X1,X2,???,Xn~N(0,σ),统计量T=∑Xk,求E(Xk2T)。 2 k=1n 解:令S=∑Xk2,则E(Xk2T)= k=1 n 1 E(ST)。 n ?Y1??X1? ? ?Y 2? X2?作正交变换:Y= ??=C ??,其中C 为正交阵,第一行为 ???, ? ??? ? ? Y? X??n??n? 则有EY=0,Cov(X,Y)=CC=In,即T与∑Yk2独立,Yk~N(0,σ2),k=2,???,n, T k=2 n T2n2 从而S=∑X=∑Y=+∑Yk。 nk=2k=1k=1 n 2 k n 2k T2关于σ(T)可测,所以E(Xk2T)= 1 E(ST) n 1T2n2T21 =E[(+∑Yk)T]+(1-)σ2 nnk=2nn方法三:通过猜想,再利用公理化定义证明。 例 3 设X服从标准正态分布,其概率函数F( x)= E(XX)。 ? x -∞ edt,x∈R,求 - t22 解:设A={{X}-1(-∞,x)x∈R},则A是一个π类。 ?A∈A,?EXXdP=?I(X<> A () ? 令B=?AA∈σ(X ???1? EXdP=0)?A 2??,则A?B。 ??? 下面先证B是一个λ类, (i)若A∈B, 则 Ac∈B。 ? Ac E(XX)dP=?E(XXdP)-?EX(XdP)= Ω A 0即, (ii)若A∈B,B∈B,且AB=?,则 ? A+B E(XX)dP=?E(XX)dP+?E(XX)dP=0即A+B∈B。 A B n ?? (iii)若An↑,且An∈B,则?E(XX)dP=?I?lim Ak?E(XX)dP limAnn?n→∞k=1? n =?limI AkE(XX)dP n→∞ k=1 =lim?IAnE(XX)dP n→∞ =0 即limAn∈B。 n 综合(i)、(ii)、(iii)可知B是一个λ类,由π-λ定理可知,B=σ(X). 从而?A∈σ(X),?E(XX)dP=?0dP,又0关于σ(X)可测,即 AA E(XX)=0,a.s. 从以上例题可以看出,条件期望的求法是一个复杂的问题,在具体的情形下我们必须从问题本身出发去寻求解决问题的方法,通过化简,将其转化为可测或独立于σ代数的随机变量,然后运用条件期望的性质求解。以上从三个方面给出了求解条件期望的三种途径,也是较多时候可以采用的三种途径。 5 条件期望的应用 5.1 利用条件期望计算数学期望 由条件期望的定义1可知,要计算E(X),可取在条件Y=y下,X的条件期 望的加权平均,加在每一项E(XY=y)的权重等于作为条件的那个事件的概率, 这是一个极为有用的结果,采用这种对适当的随机值先“条件化”的方法,往往 能够较容易地把数学期望计算出来。下面举例说明其用法。 例4 假设一天内进入某景点的游客人数均值为50的随机变量,进一步假设 每个游客消费的钱数为6元的独立的随机变量,且每个顾客消费的钱数与一天内 进入景点的游客数也是独立的,求某天游客总消费钱数的期望值。 解:令N表示进入这个景点的游客人数,令Xi表示第i个游客在这个景点消费的钱数,则所有游客消费的钱数为∑Xi,现在有 i=1N ??N??E(∑Xi)=E?E ∑XiN?? i=1????i=1 N ?N? 而E(∑XiN=n)=E E∑Xi?=nE(X) (由Xi与N的独立性知) i=1?i=1?其中E(X)=E(Xi)。这意味着E(∑XiN)=NE(X),因此 i=1N N E(∑Xi)=E??NE(X)??=E(N)E(X)=50?6=300 i=1 N 故由上面的结果可知,某天有课总消费钱数的期望值为300元。 例5 一矿工被困在有三个门的矿井中,第一个门通过一坑道,沿此坑道走3 小时可使他到达安全地点;第二个门通到使他走5小时后又转回原地的坑道;第 三个门通到使他走7小时后回原地的坑道。如设这矿工在任何时刻都等可能地选 定其中一个门,试问他到达安全地点平均要花多长时间? 解:令X表示该矿工到达安全地点所需时间(单位:小时),Y表示他最初 选定的门,应用全数学期望公式,有 E(X)=E??E(XY)?? =E(XY=1)P(Y=1)+E(XY=2)P(Y=2)+E(XY=3)P(Y=3) 1 E(XY=1)+E(XY=2)+E(XY=3)? =?, ??3 易知E(XY=1)=3; 现在考虑计算E(XY=2)。设该矿工选择第二个门,他沿地道走5小时后又 转回原地,而一旦他返回原地,问题就与当初他还没有进第二个门之前一样。因此,他要到达安全地点平均还需要E(X)小时,故 E(XY=2)=5+E(X); 类似地,有 E(XY=3)=7+E(X), 1 3+5+E(X)+7+E(X)?从而 E(X)=??。 3? 解得 E(X)=15。 所以他到达安全地点平均要花15小时。 此类问题同游客在旅途中平安脱险所用时间的解决方法类似,不再一一做一 说明。 例 6 箱内有a个白球和b个黑球,每次从中随机地取出一球,直到首次取得 白球为止,求被取出的黑球的平均数。 解:设X表示被取出的黑球数,记Ma,b=E(X),定义 Y=1,如第一个被抽出的球是白色; Y=0,如第一个被抽出的球是黑色。 则 Ma,b=E(X)=E(XY=1)P(Y=1)+E(XY=0)P(Y=0)。 但是 E(XY=1)=0, E(XY=0)=1+Ma,b-1, P(Y=0)= 于是 Ma,b= b a+b b 1+Ma,b-1), (a+b11 1+M= Ma,1=(a,0)a+1, a+122 1+Ma,1)= Ma,2=。 (a+2a+1 b 用归纳法易证 Ma,b=。 a+1 5.2 利用条件期望求随机变量的方差 因为对任一随机变量X,有公式D(X)=E(X2)-?因此可用条件期 ?E(X)??, 2 望来计算方差。 例 7 若保单持有人在一年保险期内发生意外事故死亡,赔付额为100000元; 若属于非意外死亡,赔付额为50000元;若不发生死亡则不赔付。根据历史数据 记录,发生意外和非意外死亡的概率分别是0.0005和0.0020,试讨论第i张保单 理 赔的概率分布。 解:用I表示理赔次数,I=1表示有死亡事故发生需要赔付; I=0则表示事故发生不需要赔付。 若用A表示需要赔付的数额,A不再是一个常数,而是一个与I有关的随 机变量,依题意有 P(I=1,A=100000)=0.0005,P(I=0,A=50000)=0.0020 而且令q=P(I=1), 则q=P(I=1)=P(I=1,A=100000)+P(I=0,A=50000)=0.0025, 1-q=P(I=0)=1-P(I=1)=0.9975。 因此,记Xi=IA,其中A的条件分布概率为 P(A=50000I=1)=0.8,P(A=100000I=1)=0.2 且有 E(Xi)=E??E(XiI)?? =P(I=0)E(XiI=0)+P(I=1)E(XiI=1) =(1-q)?0+qE(AI=1) =q??50000P(A=50000I=1)+100000P(A=100000I=1)?? =0.0025?(50000?0.8+100000?0.2) =150 则 D(Xi)=E(Xi2)-??E(Xi)?? 2 2 EXI)? =E?(i?E(Xi)?? ??-? 2 =P(I=0)E(Xi2I=0)+P(I=1)E(Xi2I=1)-??E(Xi)?? 2 =qE(A2I=1)-1502 =0.0025?(500002?0.82+1000002?0.2)-1502 =4977450 例 8 接连做一独立重复试验,每次试验成功的概率为p。设X表示出现首 次成功所需的试验次数,求D(X)。 解:设Y=1,如第一次实验结果成功; Y=0,如第一次实验结果失败。 2 EXY)? 因为 E(X2)=E?(?? E(X2Y=1)=1 2 E(X2Y=0)=E?E(1+X)? ?? 因此 E(X)=E(X2Y=1)P(Y=1)+E(X2Y=0)P(Y=0) 2 =p+(1-p)E?(1+X)? ?? =1+(1-p)E(2X+X2) 2(1-p) =1++(1-p)E(X2) p 或 E(X2)= 2-p p2 故 D(X)=E(X 2 ?)-??E(X)? 22 2 2-p?1?1-p =2- ?=2 pp?p? 在实际生活中条件数学期望的应用也比较广泛,这需要仔细观察。 5.3 条件期望在商业决策中的应用 在商业竞争中,商家必须对某种商品未来一段时间内的销售状况作出合理的 预测,才能使自己获得最大利润,或使得损失最小。这就要求决策者们根据以往 的销售情况及最新的信息资料进行综合分析作出决策。利用贝叶斯公式[]计算条 9 件数学期望,就是商业决策中的一种方法,下面以具体实例来介绍此方法的运用。 例 9 三部自动的机器生产同样的汽车零件,其中机器甲生产的占40%,机 器乙生产的占25%,机器丙生产的占35%。 平均说来,机器甲生产的零件有10% 不合格,对于机器乙和丙,相应的百分数分别是5%和1%。如果从总产品中任意 的抽取一个零件,发现为不合格,试问: (1)它是由机器甲生产出来的概率是多少? (2)它是由哪一部机器生产出来的可能性最大? 分析:本例是在“取得的零件为不合格品”已经发生的条件下,计算该零件 由机器甲、乙、丙生产的概率,即由“结果”“推断”“原因”发生的概率。考虑 用贝叶斯公式,令 B=“取得的零件为不合格品”, A1=“取得的零件由机器甲生产的”, A2=“取得的零件由机器乙生产的”, A3=“取得的零件由机器丙生产的”, 则 P(A1)=0.40, P(A2)=0.25, P(A3)=0.35, PBA1=0.10, PBA2=0.05, PBA3=0.01。 () ()() (1)根据题意指的是计算P(A1B),由贝叶斯公式,有 P(A1B)= P(A1)P(BA1) PA1PBA1+PA2PBA2+PA3PBA3 = (0.40)(0.10) 0.400.10+0.250.05+0.350.010.04 ≈0.714。 0.056 = (2)类似(1)的计算,可得 P(A2B)= P(A3B) (0.25)(0.05)≈0.223, 0.056 0.35)(0.01)(=≈0.063。 0.056 可见,机器甲生产的可能性最大。 例10某服装商场根据以往的资料,预测服装在未来一段时间内畅销的概率为0.4,滞销的概率为0.6,现有两种销售方案(1)打折处理:预计在商品畅销时可获利6万元,在商品滞销时可获利2万元;(2)对商品重新包装,做广告宣传,仍按原价销售,预计在商品畅销时可获利10万元,在商品滞销时将损失4万元。 为了做出正确决策,先进行了一段时间的试销,发现原来认为畅销的商品实际畅销的概率为0.6,实际滞销的概率为0.4;原来认为滞销的商品实际畅销的概率为0.3,实际滞销的概率为0.7,根据这些资料我们来分析一下,采用哪种销售方案最佳。 分析:我们用A1表示预测商品畅销,A2表示预测商品滞销,B1表示实际商品畅销,B2表示实际商品滞销,X表示采取第一方案所取得的利润,Y表示采取第二方案所取得的利润。 则X取值为6,2,Y取值为10,-4。且X=6与Y=10表示预测商品畅销,即事件A1;X=2与Y=-4表示预测商品滞销,即事件A2。 于是P(A1)=0.4,P(A2)=0.6,P(B1A1)=0.6, P(B2A1)=0.4, P(B1A2)=0.3, P(B2A2)=0.7, 由贝叶斯公式知 P(A1B1)= PA1PB1A1+PA2PB1A20.4?0.64 =, 0.4?0.6+0.6?0.37 P(A1)P(B1A1) = P(A2B1)= = PA1PB1A1+PA2PB1A20.6?0.33 =, 0.4?0.6+0.6?0.37 P(A2)P(B1A2) P(A1B2)= = PA1PB2A1+PA2PB2A20.4?0.48 =, 0.4?0.4+0.6?0.729 P(A1)P(B2A1) P(A2B2)= = PA1PB2A1+PA2PB2A20.6?0.721 =。 0.4?0.4+0.6?0.729 P(A2)P(B2A2) 因此,实际畅销商品采取第一方案的利润均值为 E(XB1)=6P(X=6B1)+2P(X=2B1) =6PA1B1+2PA2B1=6? ()() 43 +2?≈4.29, 77 实际滞销商品采取第一方案的利润均值为 E(XB2)=6P(X=6B2)+2P(X=2B2) =6PA1B2+2PA2B2=6? ()() 821+2?≈3.10, 2929 实际畅销商品采取第二方案的利润均值为 E(YB1)=10P(Y=10B1)+(-4)P(Y=-4B1) =10PA1B1-4PA2B1=10? ()() 43 -4?=4, 77 实际滞销商品采取第二方案的利润均值为 E(YB2)=10P(Y=10B2)+(-4)P(Y=-4B2) =10PA1B2-4PA2B2=10? ()() 821-4?≈-0.07。 2929 由此可以看出,不论是实际畅销还是实际滞销的商品,采取第一销售方案的利润均值(条件期望)都大于第二方案,故应采取第一方案进行销售。 5.4 条件期望在预测中的应用 条件期望在预测问题中有重要作用,主要是通过“均方误差最小”解决一类 最优预测问题。 例 11 设身高为x(cm)的男子其成年儿子的身高服从均值为x+3,方差为10的正态分布,问身高为175cm的男子,其成年儿子的身高的最佳预测值是多少? 分析:令X表示父亲身高,Y表示儿子身高,则Y=X+3+ζ,其中 ζ~N(0,10),ζ与X独立,由条件期望的“均方误差最小”定理可知,Y 的最佳预测是 E(YX=175)=E(X+3+ζX=175) =175+3+E(ζX=175)=178+Eζ=178(cm) 例 12 设到达某车站的顾客数为参数是λ的泊松流,求在时间间隔(0,t]中, 所有到达顾客等待的时间和的平均值。如果每分钟有5个顾客到达该车站,每20分钟有一列车通过该车站,求一天(24小时)在该车站由于等待乘车而浪费的平均时间和。 分析:设在(0,t]中到的顾客数为X(t),Wj为第j个顾客到达的时刻,η为第 j个顾客的等车时间,则{X(t),t≥0}为参数是λ的泊松流,η=t-Wj,所有到达 顾客到时刻t的等待时间和的平均值为E 因为对任意0≤s≤t,有 PWj≤sX(t)=n= ∑(t-W) j j=1 X(t) {} P{Wj≤s,X(t)=n}PXt=nPXt=n = P{X(S)≥j,X(t)=n} ∑{X(S)=k,X(t)-X(S)=n-k} = PXt=nk=j n ∑P{X(S)=k}?P{X(t-S)=n-k} = PXt=nk=j n ∑eλ - n s (λs) k! k ?e -λ(t-s) = k=j ??λ(t-s)??n-k! n (n-k) e-λt (λt) n! ss =∑C- ttk=j kn n kn-k ,j=1,2,???,X(t)。 由上式可知,在X(t)=n下,Wj就相当于n个独立同服从区间[0,t]上的均匀 分布随机变量的第j个顺序统计量。设ζ1,ζ2,???,ζn为独立同分布随机变量,且 ** 为ζ1,ζ2,???,ζn的顺序统计量,则由于 ,???,ζnζ1~U(0,t)并设ζ1*,ζ2 X(t)j=1 X(t)j=1 E ∑(t-W)=EE∑(t-W)X(t) j j 且 E ∑(t-W)X(t)=n=E∑(t-W)X(t)=n j j j=1 j=1 X(t) n =nt-E ∑W j=1nj=1 n j X(t)=n=nt-∑EWjX(t)=n=nt-∑E(ζ*j) j=1 j=1 nn =nt-E ∑ζ=nt-E∑ζj=nt- *j j=1 j n ntnt= 22 所以 E ∑(t-W) j=1 X(t) tX(t) X(t)= 2t(X)(t)λt2 =E= 22 从而 E ∑(t-W) j j=1 X(t) 因为λ=5人/分,所以一天(24小时)顾客由于等车而浪费的平均时间和为: 5?20260 ??24=72000(分钟)=1200(小时) 220 由上可知,如果增加车次,顾客浪费的时间少。例如,假设每10分钟有一 列车通过该站,即t=10(分钟),则一天顾客由于等车浪费的平均时间和为600(小时),但是车次增加,满载率将减少也会造成浪费,即钱的浪费。而如何确定车次,使时间、金钱的浪费最小,这是运筹学所要研究的优化问题。 小结:通过“均方误差最小”可以解决一系列的预测问题,在当前的社会, 经济发展是重要问题。通过条件期望可以预测小至一个公司的日常运作,大至世界经济的发展方向,并且可以根据它所做出的预测作出相应的决策。所以,条件期望的经济应用将会越来越为人们所关注。 结束语 通过本文的讨论可以看出,条件期望定义和性质的学习是有一定难度的,但是它在数学与其他领域都有着广泛的应用。如果我们能对其进行系统的学习和总结,而且在适当时候应用上述定理对问题加以分析,那我们就可以对问题有更加深入更加广泛的了解。 【参考文献】 [1]茆诗松,程依明,濮晓龙. 概率论与数理统计教程[M]. 北京:高等教育出版社,2004. [2]朱福国. 条件期望的两种定义及其等价性讨论[J]. 大学数学,2011. [3]魏艳华,李艳颖,王丙参. 条件期望的性质及求法[J]. 牡丹江大学学报,2009. [4]杨丽云. 条件期望和相关系数[J] . 河北理工学院学报,1996. [5]赵志文,杨丰凯.关于条件期望求法的讨论[J]. 吉林师范大学学报(自然科学版), 2005. [6]郑庆玉. 条件数学期望的应用[J]. 临沂师专学报,1995. [7]张梅. 利用条件期望解决最优预测问题举例[J]. 陕西教育学院学报,2006. [8]杜伟娟. 对于条件数学期望应用的探讨[J]. 牡丹江教育学院学报,2007. [9]缪铨生. 概率与统计[M]. 上海:华东师范大学出版社,2007. [10]张天铮. 条件数学期望在商业决策中的应用[J]. 统计应用,1998. The nature and application of the conditional expectation (School of Mathematics and Computer Engineering,Xi'an University of Arts and Science,Shaanxi Xi'an, 710065) Abstract: The conditional mathematical expectation (hereinafter referred to as the conditional expectation) is a very important concept in the theory of stochastic analysis and has important applications in the theory and practice. In this paper, several definitions of the conditional expectation and nature are analyzed at first. Then the several evaluations of the conditional expectations are studied. At last, the cases in the actual problem are combined to analyze the application of conditional expectation. Key words: conditional expectation; definition; nature; application 毕 业 设 计(论文) 2011 届 题 目 条件概率及条件期望 专 业 数学与应用数学 学生姓名 唐巍巍 学 号 07071114 指导教师 唐矛宁 论文字数 1 万字 完成日期 2010 年 12 月 15 日湖 州 师 范 学 院 教 务 处 印 制 条件概率及条件期望 唐巍巍 摘 要:条件概率和条件期望是概率论中两个非常重要的概念.在生活中常常 会遇到已知一个随机事件发生的概率求在这个随机事件发生的条件下另一个随机事 件发生的概率也就是条件概率.条件期望也就是条件分布的数学期望.已知随机变量 的条件分布条件期望作为数字特征能很好地反映它的平均特征.本文首先总结了条 件概率和条件期望的应用并通过具体的实际应用例子说明了条件概率和条件期望的 重要应用意义最后分别讨论了条件期望基础上的全概率公式和 代数下的条件期望 公式. 关键词:条件概率条件分布条件期望 -代数 IConditional Probability and Conditional Expectation Tang Wei-wei Abstract: Conditional probability and conditional expectation are very important in thetheory of probability concepts. In daily life by the probability of a random event which we havealready known we can find out the probability of this random events under the condition ofanother random event. We also call it conditional probability. Conditional expectation ismathematical expectation of conditional distribution. The conditional distribution of a randomvariable is known we can also know that the conditional expectations as figure features can wellreflect its average characteristic. In this paper we firstly summarize the conditional probabilityand the applications of conditional expectation. And these specific practical application examplesshow the important application meaning of conditional probability and conditional expectation.Finally we discussed the full probability formula respectively based on conditional expectationand conditional expectations under - algebra. Key words: Conditional probability Conditional distribution Conditional expectation -algebra 目 录 引 言 ………………………………………………………………………………………… ……11、条件概率的定义及应 用………………………………………………………………………1 1.1 条件概率的 定义…………………………………………………………………………1 1.2 乘法公 式…………………………………………………………………………………2 1.3 全 概率公式………………………………………………………………………………3 1.4 贝叶斯公 式………………………………………………………………………………32、条件期 望的定义及其性质……………………………………………………………………5 2.1 条件期望的定义…………………………………………………………………………5 2.2 条件期望的性 质…………………………………………………………………………5 2.3 条件期望 的应用 ………………………………………………………………………73、条件期望 的推广应用 …………………………………………………………………7 3.1 条件期 望基础上的全概率公式 ………………………………………………………7 3.2 -代 数下的条件期望 ………………………………………………………………8结 论 ………………………………………………………………………………………… ……11参考文 献 …………………………………………………………………………………………12致 谢 ………………………………………………………………………………………………13 引言 概率论是近代数学中一门重要的学科在近半个世纪的快速发展中它被广泛应用于各个领域特别是条件概率在农业工程科学研究和社会活动中被广泛地应用,如天气预测产品质量检测临床医学 1 2 等等. 条件概率应用广泛特别是全概率公式和贝叶斯公式它们更能提供有价值的信息当试验的随机过程大于等于两个的时候用初等的全概率公式和贝叶斯公式不能很好地反映事件间的相互影响的次序在张丽 3 等人的文中他们将全概率公式和贝叶斯公式进行了推广解决了这个问题.对本文而言我们利用初等的全概率公式和贝叶斯公式就能很好地解决被确定是犯罪者真正是犯罪者 4 的概率问题. 条件期望作为条件概率的数字特征能很好地反映它的平均特征但在计算一些复杂的问题的时候初等条件期望是不够用的所以人们就想着在给出函数的条件下给出类似初等条件概率的定义然而要把这种定义推广到一般空间上是有一定难度的人们试着把条件概率和测度的知识结合起来解决了这个问题在宋熠 5 的文中他给出了 代数下给定函数的条件数学期望将条件期望推广到了一般抽象空间. 代数下给定函数的条件数学期望拥有很好的性质能很好地反映条件概率的平均特征. 条件概率是基础在条件概率下才有它的数字特征——条件期望但是反过来基于条件期望也能推广出更广泛的全概率公式关键是要给出随机事件的示性函数在徐辉和邬国根 6 的文中有详细的论诉而且推广的全概率公式在实际应用和可靠性研究中都有很大作用.所以作为数字特征条件期望既能反映条件概率的平均水平又能基于它推广出更广泛的全概率公式可见它们之间关系密切而且研究条件概率和条件期望也有很强的实际意义. 本论文分为三个部分,首先介绍了条件概率定义,并通过具体的实际应用例子说明了条件概率的重要应用意义;然后介绍条件期望的定义和应用并通过具体的实际应用例子说明条件期望的重要应用意义;最后分别讨论了条件期望基础上的全概率公式和 代数下的条件期望公式. 1、条件概率的定义及应用1.1 条件概率的定义 1 定义 1.1.1:设 A 与 B 是样本空间 中的两事件若 P B 0 则称 PAB PA B (1.1.1) PB为在 B 发生下 A 的条件概率(简称条件概率( 性质 1 1.1.1: 条件概率是概率即若设 P B 0 则 1 P A B 1 P A B . 2 P A1 A2 B P A1 B P A2 B P A1 A2 B . 3 P A B 0 A F . 4 P B 1 . 1 5若 F 中的 A1,A2, ,An, 互不相容则 P An B P An B . n1 n 11.2 条件概率的应用 在计算一些复杂的实际应用题时下面这三个条件概率公式更加有用:(1) 乘法公式 1 这个公式主要应用于求事件交的概率.定义如下: 若 P B 0 则 P AB P B P A B . 1.2.1 若 P A1 A2 An 1 0 则 P A1 An P A1 P A2 A1 P A3 A1 A2 P An A1 An 1 . 1.2.3 (2)全概率公式 1 全概率公式是概率论中一个基本但重要的公式所以我们有必要探讨它的使用条件便于应用到实际问题中. n 设 B1,B2, ,Bn 为样本空间 的一个分割即 B1,B2, ,Bn 互不相容且 B i 如 i 1果 P Bi 0,i 1, ,n 则对任一事件 A 有 2, n P A PB P A B . i 1 i i 1.2.4 1(3)贝叶斯公式 基于上述乘法公式和全概率公式的概念我们可以得到一个求条件概率更有用的公式即贝叶斯公式形式如下: n 设 B1,B2, ,Bn 为样本空间 的一个分割即 B1,B2, ,Bn 互不相容且 B i 如果 i 1PA 0 P Bi 0,i 1, ,n 则 2, P Bi P A Bi P(B i A) n ,i 1, ,n . 2, (1.2.5) P B j 1 j P A B j 介绍了上述几个公式 以后我们来举例应用一下. 例 1.1 设 P B 0 试证 P A P A B 1 . P B 证明: P A B 1 P A P B P AB 1 P B 1 P A P AB P B P A P AB P B P A P A B P B 2 P B P A P A B P B P A 即 P A B 1 . P B 在生活中求条件概率应用最多的 是贝叶斯公式这里举了一道典型的例子. 例 1.2 假设用指纹来确定犯罪者现场提取 的指纹难免有一些模糊故结果不是十分确定.设经对比真正的犯罪者被确定为犯罪 者的概率为 0.9被确定为无罪的概率为 0.85.现对一批概率为百万分之五的人的指 纹进行对比某人被确定为罪犯求此人真正是罪犯的概率, 解:设 A 某人被确定为 罪犯 B 某人是真正的罪犯 C 某人不是罪犯 P B 0.0005 P C 0.9995 P A P A B P B P A C PC 0.9 0.0005 0.15 0.9995 0.150375 . P A B P B 0.9 0.0005 P B A 0.00299 . P A 0.150375 结果表明某人被确认为罪犯而他是真正的罪犯的概率不大 但是如果已知某人的指纹与现场指纹相符那么他是罪犯的概率就要提升为 20明显 概率大大提升了这也揭示了条件概率的逻辑特点以不同的条件为前提结果大相径庭. 2、条件期望的定义及其性质2.1 条件期望的定义 在介绍条件期望的定义之前首先 引入条件分布的定义实际上条件分布就是本论文第一部分介绍的条件概率. 定义 2.1.1 1 :(离散随机变量的条件分布) 对一切使 P Y y j p j p i 1 ij 0 的 y j 称 P X xi Y y j p ij pi j P X xi Y y j ,i 1, 2, (2.1.1) PY y j p j为给定 Y y j 条 件下 X 的条件分布列. 同理对一切使 P Y xi pi pj 1 ij 0 的 xi 称 P X xi Y y j pij p j i PY y j X xi ,j 1, 2, (2.1.2) P X xi pi为给定 X xi 条件下 Y 的条 件分布列. 有了离散型随机变量的条件分布列我们就可以给出条件分布函数. 定义 2.1.2 1 : 3 给定 Y y j 条件下 X 的条件分布函数为 F x y j P X x Y y xi x i j p xi x i j . (2.1.3) 给定 X xi 条件下 Y 的条件分布函数为 F y xi PY y yj y j X xi p yjy ji . (2.1.4) 1 定义 2.1.3 :(连续随机变量的条件分布) 对一切使 pY y 0 的 y 给定 Y y 条件下 X 的条件分布函数和条件密度函数分别为 p u y x F x y du, (2.1.5) p y Y p x y p x y . (2.1.6) pY y 对一切使 p X x 0 的 x 给定 X x 条件下 Y 的条件分布函数和条件密度函数分别为 p x v y F y x dv, (2.1.7) p X x p x y p y x . (2.1.8) p X x 下面是条件期望的定义. 定 义 2.1.1 1 : x i P X xi Y y , Y 为二维离散随机变量; X i EX Y y xp x y dx, (X Y)为二维连续随机变量. y j PY y j X x, Y 为二维离散随机变量; X EY X x j yp y xdy,(X Y)为二维连续随机变量.2.2 条件期望的性质 1 性质 2.2.1 :若 c 是常数则 E X c Y y c ( (2.2.1) 性质 2.2.2 1 :对任意常数 a、b有 E aX b Y y aE X Y y b . 2.2.2 1 性质 2.2.3 :对任意的两个函数 g1 x 和 g 2 x 有 Eg1X g2XY y Eg1XY y Eg2XY y . (2.2.3) 下面我们来看两个条件期望应用的例子. ( 例 2.2.1 设二维随机变量 X Y)的联合密度函数为 1 x y0 y 1; p x y o 其 他的范围. 求 E Y X x . 解:当 y 1 或 y 1 或 y 0 时 pY x y 0 . 当 1 y 0 时 y pY x y dx y 1 1 4 1 5 故 E Y X x ypY x y y y 1dy 0 6 . 当 0 y 1 时 y pY x y dx y 1 1故条件期望为 1 1 E Y X x ypY x y y.范文五:条件概率及条件期望