范文一:二项分布方差公式推导
二项分布方差公式推导
若ξ,B(n,p),q=1-p,求证Dξ=npq
kn-kk-1n-kkk,1?Eξ=np, kCpq=nppq, nCn,1
kn-kk-1n-kk-1n-kkk,1k,1kk Cpq=np[(k-1)pq,pq] nCCn,1n,1
k-2n-kk-1n-kk,2k,1=np[(n,1)ppq,pq] CCn,2n,1
22而Dξ=, ,()E,E,
n-1kn-k12n-212k?Dξ=(1×1×Cpq,2×2 Cpq,…,k×k Cpqnnn
2n0n,…,n×nCpq) ,n()np
n-101n-22n-2012=np(1×Cpq,2Cpq,3Cpq,…,n-1n-1n-1
k-1n-kk-1k Cpq n-1
22nn-10n-1,…,nCpq),2np Eξ,np(p,q) n-1
n-1001n-22n-212=np{[0×Cpq,1Cpq,2Cpq,…,n-1n-1n-1
k-1n-kn-1k-1n-1n-1000(k-1) Cpq,…,(n-1)Cpq],(Cpq,n-1n-1n-1
k-1n-k1n-22n-212k-1Cpq,Cpq,…,Cpq,…,n-1n-1n-1
2n-1n-10Cpq)} ,()npn-1
2n-1=np[Eη,(p,q)] ,()np
2=np[(n,1)p,1] ,()np
=np(1,p)
=npq .
范文二:二项分布近似公式的限制条件及修正
第23卷第6期
2007年12月大 学 数 学COLL EGE MA T H EMA TICS Vol. 23, №. 6Dec. 2007
二项分布近似公式的限制条件及修正
王雅玲
(北京工商大学数学系, )
[摘 要]中心极限定理使我们可以在“n , 从而计算相关事件概率的近似值. , 仅注意到n 的绝对大小是不够的. n , 要视p 值而定, 并根据n , p 间的关联性, , , 对其进行了修正.
[; ; 限制条件; 近似公式
[]11 [文献标识码]C [文章编号]167221454(2007) 0620146204
1 问题的提出
n 重贝努利概型在概率论的理论研究和实际应用中都有重要的意义, 与其相对应的二项分布是概率论中最重要的分布律之一, 在研究产品质量, 工作效能, 指标控制等实际问题中得到广泛应用. 在对这些问题进行决策时, 不可避免地要涉及到关于二项分布的计算问题. 对于服从二项分布的随机变量, 我们经常借助两个定理———泊松定理和棣莫弗—拉普拉斯定理, 进行近似计算.
泊松定理 设λ>0是一常数, n 是任意正整数, 记n p n =λ, 则对于任意一个固定的非负整数k , 有
lim n p n (1-p n ) k n -k =e -. k ! λk ) 服从参数为n , p 的二项分布, 则对棣莫弗—拉普拉斯中心极限定理 设随机变量ηn (n =1, 2, …
于任意x , 有
2x η-2≤x =lim d t =Φ(x ) . n →∞-∞() p 1-p π∫
根据这两个定理, 得到关于二项分布近似公式:设X ~B (n , p ) , 当n 充分大时, 有
x k -λP (X ≤x ) ≈∑e ,
k =0k ! (1)
(2) P (X ≤x ) ≈p (1-p ) .
对于泊松定理的应用, 由条件n p n =λ(常数) , 显然意味着当n 很大时, p n 很小. 因此, 许多教材都提到, 当n 较大, p 较小时有近似公式(1) , 并给出了不同的建议值. 如在[1]中要求n ≥10, p ≤011; [2]中要求n ≥20, p ≤0105, 并且说明, 当n ≥100, n p ≤10时, 效果更好.
但是, 对于应用棣莫弗—拉普拉斯中心极限定理进行近似计算, 即关于公式(2) 的应用条件, 相关讨论则简略得多. [2]描述为:当n 充分大时, 可作近似计算. [1]则夸张为:正态分布作近似计算, 它的优点是不受
“p ≤011”限制, 只要n 足够大即可.
这就给初学者或者是非专业的应用人员造成一种错觉, 似乎在任何情况下都可以用公式(2) 作近似计算, 公式(2) 比公式(1) 优越得多([2]在其第三版中删除了有关泊松定理的内容, 更使以此书为教材的 [收稿日期]2005212223
第6期 王雅玲:二项分布近似公式的限制条件及修正147学生加深了这一认识) . 但事实并非如此, 我们通过一个实例来加以说明. 例 分析病史资料表明, 因患感冒而最终导致死亡(相互独立) 的比例占012%. 目前正在患感冒的有1000个人. 求这1000个病人中, 最终死亡人数不超过2个人的概率.
1000人中的死亡人数为随机变量X , 服从二项分布B (1000, 01002) . 直接计算, 得
P (X ≤2) =P (X =0) +P (X =1) +P (X =2) =01676677.
由公式(1) 得
2
P (X ≤2) ≈
k =0λ-k k ! =01676676.
由公式(2) 得P (X ≤2) ≈×0. 002×(5显然, 公式(1) 给出了很好的近似结果, . 由此可见, 与公式(1) 一样, 应用公式(2) , 不仅要求n , , 所谓的n 足够大是与p 密切相关的. 2 公式(2) 中心极限定理的证明[3], 要用到一个结论:
m 3!
m 对于固定的p , t , 结论:3! pq 3=o n . 3=o n 显然没有问题. 也就是说, 这一结论用于证明棣莫弗—
拉普拉斯中心极限定理是充分的. 但是, 对于公式(2) 而言, 则意味着对我们所认可的能够应用公式(2)
m 的n , 3! pq 3(1/n ) 应当足够小. 抛开因素t , 令
δ(n , p ) =m 3! 3(1/n ) =m 6pq pq ,
δ(n , p ) 充分小”则条件“是有效应用公式(2) 的限制条件. 当然, 只要n 充分大, 就可使得δ(n , p ) 充分小, 但是, 这里忽略了p 的取值对δ(n , p ) 的影响.
事实上,
|C m (s ) |=pq +p -2p q cos s 4422
于是有
pq 4422+q -2p q ≤|C m (s ) |≤pq +q +2p q , 4422
即
pq |p -q |≤|C m (s ) |≤pq |p 2+q 2|.
故
δ(n , p ) =6pq 6n
令u =(n , p ) u -, 则δ. 而u p 6n
lim u -u →0-p . q u =lim u -u →∞u =+∞.
这说明当事件A 发生的概率过小(p →0) 或过大(p →1) 时, δ(n , p ) 随之快速增大. 要使δ(n ,
p ) 足够小, 所需要的n 是非常大的. 换句话说, 使用公式(2) 时, 要根据p 的大小来设定n 的大小, 即根据p 的不同, n 所要实现的“充分大”的程度是不同的. 因此简单笼统地说“n 充分大“是不够的, 有必要将n , p
148大 学 数 学 第23卷共同融入公式(2) 的限制条件.
由pq |p -q |≤|C m (s ) |≤pq (p 2+q 2) 可得
6n pq δ(n , p ) ≤≤226n pq .
故当226pq 充分小时, 有公式(2) 成立.
但是, 近似计算的目的是为了简便快捷, 又不失有效性, 其限制性条件也应符合这一要求, 因此需将226pq 简化, 并将“充分小”量化.
不妨设0
2226pq 6于是, 限制条件可设定为α, 则称充, 即对给定的一个很小的正数α, 若≤6n pq 6pq
分小. α越小, 近似效果越好. 若以统计推断中常用的α=0105为标准, 应限制
若要使近似效果更好, 取α=0101, 则应限制pq >n pq >, 即n pq >11; 3, 即n pq >277. 3
3 公式(2) 的修正若随机变量X ~B (n , p ) , x 为整数, 0≤a <1, 则有p="" (x="" ≤x="" )="P" (x="" ≤x="" +a="" )="" .="" 因此函数f="" (a="" )="在区间[0," 1)="" 上每一点的函数值均有理由成为p="" (x="" ≤x="" )="" 的近似值.="" 由于f="" (a="" )="" 是a="" 的p="" (1-p="">1,>
单调增函数, 故取该区间左端点(即公式(2) ) 所得到的近似值总体偏小. 有两种简单可行的修正方法:取函数值的中点2或取中点的函数值f
22, 即P (X ≤x ) ≈p (1-p )
x ++p (1-p ) , (3)
P (X ≤x ) ≈-n p . p (1-p (4)
如果以近似值与真值之间的绝对误差大小作为判别优劣标准, 通过对不同的p 值作相应的具体计算, 我们发现公式(3) 和公式(4) 分别在x 的特定值段较优于对方. 一般地, 若p <015, 则当x="">015,> 并且公式(2) , (3) , (4) 都在n p 附近时与真值间的误差 最大. 以p =013为例, 根据限制条件得n ≥53(以α= 0105为标准) . 设X ~B (53, 013) . 图1直观地反映了三 个公式的近似效果, 其中N 2, N 3, N 4分别为公式(2) , (3) , (4) 所得P (X ≤x ) 的近似值与真值的差的描点曲 线(x 取6至24间的整数) . 图1 第6期 王雅玲: 二项分布近似公式的限制条件及修正1494 结束语利用正态分布对二项分布作近似计算时不受p 值的限制, 只要n 充分大. 但“充分大”的标准不能以n 的绝对大小来衡量, 而是受到p 值的左右, p 值越小, 所要求的n 就越大. 本文提供了一个确定“充分大”的n 值的思路供大家参考, 并希望借助于修正公式, 使近似效果更好. [参 考 文 献] [1] 同济大学概率统计教研组. 概率统计[M ].上海:,20005. [2] 盛骤, 谢式千, 潘承毅. 概率论与数理统计[M ].北京:12. [3] 唐鸿龄, 张元林, 陈浩球. 应用概率[M ].南京:1of Using Approximate Formula Distribution and the Modif ied Formula W A N G Ya 2li ng (Beijing Technology and Business University , Beijing 100037, China ) Abstract :Central limit theorem lead to a conclusion :binomial distribution can be approximated by normal distribution when the parameter ‘n ’is large enough. Whether the ‘n ’has satisfied the restricted condition is dependent on the parameter ‘p ’. We attempt an analysis of the condition and modify the approximate formula. K ey w ords :binomial distribution ; normal distribution ; restricted condition ; approximate formula COL L E GE MA T H EMA T ICS Dec . 2007 2007 年 12 月 二项分布近似公式的限制条件及修正 王雅玲 ()北京工商大学 数学系 ,北京 100037 [ 摘 要 ] 中心极限定理使我们可以在“n 充分大”时用正态分布作为二项分布的近似分布 , 从而计算相 关事件概率的近似值. 本文从一个二项分布的实例谈起 , 论证了在使用二项分布近似公式时 , 仅注意到 n 的 绝对大小是不够的. 一个具体的 n 值是否达到了“充分大”这一要求 , 要视 p 值而定 , 并根据 n , p 间的关联性 , 给出了解析化的限制条件. 最后 , 考虑到该公式所得近似值总体偏小 , 对其进行了修正. [ 关键词 ] 二项分布 ; 正态分布 ; 限制条件; 近似公式 () [ 中图分类号 ] O2111 1 文章编号 ] 167221454 20070620146204 [ [ 文献标识码 ] C 1 问题的提出 n 重贝努利概型在概率论的理论研究和实际应用中都有重要的意义 , 与其相对应的二项分布是概率论中最重要的分布律之一 , 在研究产品质量 , 工作效能 , 指标控制等实际问题中得到广泛应用. 在对这 些问题进行决策时 , 不可避免地要涉及到关于二项分布的计算问题. 对于服从二项分布的随机变量 , 我 们经常借助两个定理 ———泊松定理和棣莫弗 —拉普拉斯定理 , 进行近似计算. λλ泊松定理 设> 0 是一常数 , n 是任意正整数 , 记 n p=, 则对于任意一个固定的非负整数 k , 有n k n λk λn - k - ( p 1 - ) ? .li mn p = e n n ?? k ! k ( ) η 棣莫弗 —拉普拉斯中心极限定理 设随机变量n = 1 , 2 , 服从参数为 n , p 的二项分布 , 则对n 于任意 x , 有 2 t x - η-n n p 1 2 ?x Φ( ) = e li m Pd t = x. n ?? - ??( )n p 1 - p π2 ( ) 根据这两个定理 , 得到关于二项分布近似公式 :设 X,B n , p, 当 n 充分大时 , 有x k λλ - ( )) ( 1 P X ?x? e ? , ?k ! k = 0 x - n p ( )( . ) Φ 2 P X ?x?( )n p 1 - p λ( ) 对于泊松定理的应用 , 由条件 n p=常数, 显然意味着当 n 很大时 , p 很小. 因此 , 许多教材都提到 ,n n ( ) 当 n 较大 , p 较小时有近似公式 1, 并给出了不同的建议值. 如在[ 1 ]中要求 n ?10 , p ?01 1 ; [ 2 ]中要求 n ?20 , p ?01 05 , 并且说明 , 当 n ?100 , n p ?10 时 , 效果更好. ( ) 但是 , 对于应用棣莫弗 —拉普拉斯中心极限定理进行近似计算 , 即关于公式 2的应用条件 , 相关讨 论则简略得多. [ 2 ]描述为 :当 n 充分大时 , 可作近似计算. [ 1 ]则夸张为 :正态分布作近似计算 , 它的优点 是不受“p ?01 1”限制 , 只要 n 足够大即可. ( ) 这就给初学者或者是非专业的应用人员造成一种错觉 , 似乎在任何情况下都可以用公式 2作近似 ( ) ( ) ( 计算 , 公式 2比公式 1优越得多 [ 2 ]在其第三版中删除了有关泊松定理的内容 , 更使以此书为教材的 [ 收稿日期 ] 2005212223 147 第 6 期王雅玲 :二项分布近似公式的限制条件及修正 ) 学生加深了这一认识. 但事实并非如此 , 我们通过一个实例来加以说明. ( ) 例 分析病史资料表明 , 因患感冒而最终导致死亡 相互独立的比例占 01 2 %. 目前正在患感冒的 有 1000 个人. 求这 1000 个病人中 , 最终死亡人数不超过 2 个人的概率. ( ) 1000 人中的死亡人数为随机变量 X , 服从二项分布 B 1000 , 01 002. 直接计算 , 得 ( ) ( ) ( ) ( ) P X ?2= P X = 0+ P X = 1+ P X = 2= 01 676677 . ( ) 由公式 1得 2 λ- k λe( ) = 01 676676 . P X ?2? ?k ! k = 0 ( ) 由公式 2得 2 - 1000 ×0 . 002( ) = 01 5 . Φ P X ?2?( ) 1000 ×0 . 002 ×1 - 0 . 002 ( ) ( ) 显然 , 公式 1给出了很好的近似结果 , 而公式 2给出的结果则有相当大的误差. 由此可见 , 与公式( ) ( ) 1一样 , 应用公式 2, 不仅要求 n , 对 p 也有一定的要求. 换言之 , 所谓的 n 足够大是与 p 密切相关的. ( ) 2 公式 2的限制条件 [ 3 ] 中心极限定理的证明, 要用到一个结论 : 3 m t ( )Cs 1 = o . n 3 ! n p q 3 m ( ) t C1 s 对于固定的 p , t , 结论 : = o 显然没有问题. 也就是说 , 这一结论用于证明棣莫弗 —3 ! n n p q ( ) ( ) 拉普拉斯中心极限定理是充分的. 但是 , 对于公式 2而言 , 则意味着对我们所认可的能够应用公式 2 3 m t ( ) C s ( )1/ n 的 n ,应当足够小. 抛开因素 t , 令3 ! n p q 3 m m 1 ( ) ( )Cs C s ( = )δ( ) 1/ n , n , p= 3 ! n p q 6 p q n p q ( ) ( ) ( ) δδ 则条件“n , p充分小”是有效应用公式 2的限制条件. 当然 , 只要 n 充分大 , 就可使得n , p充分小 , ( ) δn , p但是 , 这里忽略了 p 的取值对的影响. 事实上 , m 4 4 2 2 ( ) | Cs| = p q q+ p- 2 pqco ss 于是有 4 4 2 2 4 4 2 2 m ( ) + q+ 2 pq, p p + q- 2 pq?| Cs| ?p qp q 即 m 2 2 ( ) p q| p - q| ?| Cs| ?p q| p+ q| . 故 | p - q| 1 q p δ( ) n , p?=. - p q 6 n p q 6 n q 11 ( ) δ u - 令 u =, 则n , p? . 而u p 6 n 1 1 li m u - = li m u - = + ?. ??u u ?0u u ( ) ( ) δ( ) ( ) δ 这说明当事件 A 发生的概率过小 p ?0或过大 p ?1时 ,n , p随之快速增大. 要使n , p足够 ( ) 小 , 所需要的 n 是非常大的. 换句话说 , 使用公式 2时 , 要根据 p 的大小来设定 n 的大小 , 即根据 p 的 不同 , n 所要实现的“充分大”的程度是不同的. 因此简单笼统地说“n 充分大“是不够的 , 有必要将 n , p 148 大 学 数 学第 23 卷 ( ) 共同融入公式 2的限制条件. m 2 2 ( ) ) ( 由 p q| p - q| ?| Cs| ?p q p+ q可得 2 2 ( ) ( )p - q p + q ( δ) . ?n , p? 6 n p q 6 n p q 2 2 ( ) p + q ( ) 故当 充分小时 , 有公式 2成立. 6 n p q 但是 , 近似计算的目的是为了简便快捷 , 又不失有效性 , 其限制性条件也应符合这一要求 , 因此需将 2 2 ( )p+ q 简化 , 并将“充分小”量化.6 n p q 1 不妨设 0 < p="" 并在以下讨论中="" ,="" 涉及到="" p="" 时都保持这一设定.="" 对任意的="" p="" ,="" 有2="" 2="" 2="" (="" )="" p+="" q="" 1="" 1="" 1="" .="" 6="" n="" p="" q="" 6="" n="" p="" q="" 6="" n="" p="" q=""> 1 于是 , 限制条件可设定为充分小.6 n p q 1 1 α α 从数理统计的观点出发 , 所谓充分小 , 即对给定的一个很小的正数, 若?, 则称充6 n p q 6 n p q 10 αα分小.越小 , 近似效果越好. 若以统计推断中常用的= 01 05 为标准 , 应限制 n p q > , 即 n p q > 11 ;3 50 α若要使近似效果更好 , 取= 01 01 , 则应限制 n p q > , 即 n p q > 277 .3 ( ) 3 公式 2的修正 ( ) ( ( ) ) ( ) 若随机变量 X,B n , p, x 为整数 , 0 ?a < 1="" ,="" 则有="" p="" x="" =="" p="" x="" +="" a.="" 因此函数="" f="" ax="" +="" a="" -="" n="" p="" )="" (="" )="" (="" )="" φ="在区间[" 0="" ,="" 1上每一点的函数值均有理由成为="" p="" x="" 的近似值.="" 由于="" f="" a是="" a="" 的(="" )n="" p="" 1="" -="" p=""> ( ( ) ) 单调增函数 , 故取该区间左端点 即公式 2所得到的近似值总体偏小. 有两种简单可行的修正方法 :取 ( ) ( ) f 0+ f 11 函数值的中点 或取中点的函数值 f , 即2 2 x - n p x + 1 - n p 1Φ ( ( )) Φ3 + , P X ?x? 2( )( )n p 1 - p n p 1 - p 1 x + - n p 2 ( ) Φ( ) 4 P X ?x?. ( )n p 1 - p 如果以近似值与真值之间的绝对误差大小作为判别优劣标准 , 通过对不同的 p 值作相应的具体计 ( ) ( ) 算 , 我们发现公式 3和公式 4分别在 x 的特定值段较优于对方. 一般地 , 若 p < 01="" 5="" ,="" 则当="" x="">< n="" p="" 且位=""> ( ) ( ) 于 n p 附近或 x > n p 且远离 n p 时 , 公式 3优于公式 4; 当 x > n p 且位于 n p 附近或 x < n="" p="" 且远离="" n="" p="" (="" )="" (="" )="" 时="" ,="" 公式="" 4优于公式="" 3;="" 若="" p=""> 01 5 , 则情况正好相反. ( ) ( ) ( ) 并且公式 2, 3, 4都在 n p 附近时与真值间的误差 最大. ( α 以 p = 01 3 为例 , 根据限制条件得 n ?53 以= ) ( ) 01 05 为标准. 设 X,B 53 , 01 3. 图 1 直观地反映了三 ( ) 个公式的近似效果 , 其中 N 2 , N 3 , N 4 分别为公式 2, ( ) ( ) ( ) 3, 4所得 P X ?x 的近似值与真值的差的描点曲 ( ) 线 x 取 6 至 24 间的整数. 图 1 149 第 6 期王雅玲 :二项分布近似公式的限制条件及修正 4 结束语 利用正态分布对二项分布作近似计算时不受 p 值的限制 , 只要 n 充分大. 但“充分大”的标准不能以 n 的绝对大小来衡量 , 而是受到 p 值的左右 , p 值越小 , 所要求的 n 就越大. 本文提供了一个确定“充 分大”的 n 值的思路供大家参考 , 并希望借助于修正公式 , 使近似效果更好. [ 参 考 文 献 ] [ 1 ] 同济大学概率统计教研组. 概率统计[ M ] . 上海 :同济大学出版社 ,20001 5 . [ 2 ] 盛骤 ,谢式千 ,潘承毅. 概率论与数理统计[ M ] . 北京 :高等教育出版社 ,19891 2 . [ 3 ] 唐鸿龄 ,张元林 ,陈浩球. 应用概率[ M ] . 南京 :南京工学院出版社 ,19871 7 . Restricted Condit ion of Using Approximate Formula f or Binomial Distribut ion and the Modif ied Formula W A N G Y a2l i n g ()Beijing Technolo gy a nd Business U niver sit y , Beijing 100037 , Chi na Abstract : Cent ral limit t heo rem lead to a co ncl usio n : bino mial di st ributio n can be app ro ximated by no r mal di st ributio n w hen t he p arameter‘n’i s la r ge eno ugh. Whet her t he‘n’ha s sati sfied t he rest ricted co nditio n i s dep endent o n t he pa ra met er‘p’. We at temp t a n analysi s of t he co nditio n and mo dif y t he app ro ximat e fo r mula . Key words : bino mial di st ri butio n ; no r mal di st ributio n ; rest rict ed co nditio n ; app ro xi mate fo r mula 24 数学通讯
转载请注明出处范文大全网 » 二项分布方差公式推导范文三:二项分布近似公式的限制条件及修正
范文四:超几何分布、二项分布的期望与方差公式的统一证法