范文一:正态分布发展历史
正态分布发展历史
正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。
其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差
的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性) 为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义
范文二:正态分布的应用
正态分布的应用
1.零件规格的设计
由自动生产线加工的某种零件的内径X(毫米)服从正态分布N(μ,1),平均内径μ是待定的,可以通过调整该自动生产线来设定,方差σ2=1反映这条自动生产线的加工精度。
其余为合格品。销售每件合格品获利,如果加工的零件内径小于10或大于12均为不合格品,
销售每件不合格品亏损,已知销售利润L(单位:元)与销售零件的内径X有如下关系:
??1若X
??5若X>12?
问:平均直径μ为何值时,才能使销售一个零件的平均利润最大?
由于L是随机变量,它是X的函数,所以平均利润即为期望利润。由X~N(μ,1),那么X?μ~N(0,1)
E(L)=20P{10≤X≤12}?P(X12}
=20P{10?μ≤X?μ≤12?μ}?P(X?μ12?μ}
=20Φ(12?μ)?20Φ(10?μ)?Φ(10?μ)?5+5Φ(12?μ)
=25Φ(12?μ)?21Φ(10?μ)?5
可知,期望利润与平均内径μ有关,是μ的一元函数。
为了求期望利润E(L)的最大值,令dE(L)=21?(10?μ)?25?(12?μ)=0,其中dμ
Φ(x)、?(x)分别为标准正态分布的分布函数与概率密度函数,则
解之,得 212πe?(10?μ)22=252πe?(12?μ)22 即 21e?(10?μ)22=25e?(12?μ)22
μ=11?125ln≈10.9 221
由此可知,当平均内径μ设定为10.9毫米时,可使销售每个零件的平均利润最大。
2.应该购买新包装机
咖啡厂生产一磅重的罐装咖啡,自动包装线上大量数据表明,每罐重量是服从标准差为0.1磅的正态分布。为了使每罐咖啡少于1磅的产品不多于10%,应把自动包装线控制的均值μ调节到什么位置上?一台新的包装机价格是10万元,但包装的咖啡的重量服从标准差0.025磅的正态分布,同样为了使每罐咖啡少于1磅的产品不多于10%,应把自动包装线控制的均值μ调节到什么位置上?
设X表示原自动包装线上一罐咖啡的重量,则X~N(μ,0.12),假如把自动包装线的均值μ控制在1磅的位置上,那么由于X~N(1,0.12),则少于1磅的咖啡要占全部咖啡的50%,即P{X
为了使少于1磅的咖啡所占的比例不多于10%,应把自动包装线的均值μ控制在比1磅大的位置上,其中μ必须满足概率方程P{X
μ?1?μ?1?=1.28,从而 μ=1.128。即把自动包装机的均值调节于是 Φ??=0.9,由此可得0.10.1??
到1.128的位置上才能保证少于1磅的咖啡不多于10%。即:平均每每罐要多装0.128磅。
如果新买一台自动包装机,新建一条自动包装线,新包装线上每罐咖啡的重量为Y,则Y~N(μ1,0.0252),为了使少于1磅的咖啡所占的比例不多于10%,应把自动包装线的均值μ1控制在比1磅大的位置上,其中μ1必须满足概率方程P{Y
μ?1?μ?1?=1.28,所以μ1=1.032。即把自动包装机的于是Φ?1?=0.9,由此可得:1
0.0250.025??
均值调节到1.032的位置上就能保证少于1磅的咖啡不多于10%。这样平均每罐即可节约咖啡
1.128?1.032=0.096磅。
若以每日可生产2000罐咖啡计算,则每日就可节约2000×0.096=192磅咖啡。如果每磅咖啡的成本是50元,则工厂每日可增加利润9600元,11天就能赚回成本,第12天就可获净利润。因此,该咖啡厂应该购买新的包装机。
由于自动线包装的咖啡的重量X是服从正态分布的,正态分布的方差反映了包装机的精度,它不仅影响到产品的质量,而且严重影响到工厂的效益。所以,在一些产品的质量控制过程中,更重要的是要控制方差。
3.可获得超产奖的产量
益趣玩具厂装配车间准备实行计件超产奖,为此需要对生产定额作出规定。根据以往的统计资料可知,各个工人每月装配的产品件数X服从正态分布N(4000,2002)。车间主任希望10%的工人获得超产奖,那么定额标准应该是多少件?即工人每月需要装配多少件产品以上才能获得奖金?
设x0为定额标准,那么P{X≥x0}=0.1,则P{X
?x0?4000??X?4000x0?4000? P{X
查表,得x0?4000=1.28,所以x0=4000+1.28×200=4256(件)。也就是说,工人每月200
必须装配产品4256件以上才能获得超产定额奖。
4.录取分数线及考生名次的确定
某企业准备通过招聘考试招收300名职工,其中正式工270名,临时工30名;报考的人数是1657人,考试满分是400分。考试后得知,考试平均成绩μ=166分,360分以上的高分考生31人。小王在这次考试中得256分,问他能否被录取?能否被聘为正式工?
分析:因为有1657人参加考试,可以认为考试成绩X服从正态分布,且平均分μ=166
分,即X~N(166,σ2)。由于正态分布的方差σ2未知,可以根据360分以上的考生31人这个条件确定下来。然后预测小王的名次,即可回答所提出的问题。由
31?194??X?166360?166?>=0.019 P{X>360}=P??==1?Φ?σ??σ?1657?σ
194?194?=2.08,即σ≈93(可能因为考生的水平悬殊太大,导致可得Φ??=0.981,查表得σ?σ?
标准差特别大)。所以X~N(166,932),且有
?X?166256?166? P{X>256}=P>=1?Φ(0.97)=1?0.834=0.166, 9393??
0.166×1657≈275
在所有考生中,高于小王成绩的约有275人,因此小王大约名次是276名,在300名之前,他能被录取。但小王的名次排在270名之后,他只能被聘为临时工。
5.公共汽车车门高度的确定
据说公共汽车车门的高度是按成年男子与车门碰头的机会在0.01以下的标准来设计的。根据统计资料,成年男子的身高X服从正态分布N(168,72)(厘米),那么车门的高度应该是多少厘米?
设车门的高度应为a,那么应确定a使其满足
P{X≥a}≤0.01
由于X~N(168,72),则
?X?168a?168??a?168?
?a?168? =1?Φ??≤0.01 ?7?
a?168?a?168?从而Φ?≥2.33,故 ?≥0.99,因此有7?7?
a≥168+7×2.33=184.31(厘米)
由此可知,车门的高度至少应为184.31厘米。
评注:
1、理论依据:
应用标准正态分布的分布函数表计算一般正态分布有关的概率。
2、应用与推广
正态分布在自动控制、优化设计、包装或加工零件的精度以及在质量管理和控制等方面有着广泛的应用。正态分布的均值就是自动控制的设定值,方差就是自动控制的精度;方差越小,精度越高,系统的性能越好。正态分布的应用是广泛的,这里列举的只是有限的几个方面的应用。零件规格的设计是根据最优化的思想设定加工零件的内径;当新的包装机的精度大大提高的情况下应该购买新包装机;用合理的方法确定可获得超产奖的产量,使得超产奖的奖额能在预定的计划内;根据考试成绩服从正态分布的特点,应用正态分布确定录取分数线及考生的大致名次;根据正态分布的特点设定公共汽车车门高度(或者一些公共设施的
规格)的确定。
参考文献:
茆诗松等.概率论与数理统计[M].中国统计出版社.2000.7.
范文三:正态分布的完美
正态分布的完美
正态分布又名高斯分布,是一个在数学,物理及工程等领域都非常重要的概率分布,在统计学的许多方面都有着重大的影响力。许多随机现象中的随机变量都近似服从正态分布。因此,正态分布的魅力让我深深地着迷,它吸引着我对其来源与性质做了以下探究和总结。
正态分布的首次面世,是由A.棣莫弗在求二项分布的渐近公式中得到,而正态分布概念却是由德国的数学家和天文学家Moivre于1733年首次提出的,但是后世却把正态分布的发明权归功与高斯。因此,可以说正态分布具有传奇性的出生。C.F.高斯在研究测量误差时从另一个角度导出了它,P.S.拉普拉斯和高斯研究了它的性质。高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。以至于现今德国10马克钞票,其上还印有正态分布
的密度曲线。
这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。
高斯
1809年,高斯(Carl Friedrich Gauss,1777—1855)发表了其数学和天体力学的名著《绕日天体运动的理论》。在此书末尾,他写了一节有关“数据结合”(data combination)的问题,实际涉及的就是这个误差分布的确定问题。
设真值为,个独立测量值为
。高斯把后者的概率取为 其中
为待定的误差密度函数。到
此为止他的做法与拉普拉斯相同。但在往下进行时,他提出了两个创新的想法。
一是他不采取贝叶斯式的推理方式,而径直把最大的
作为
的估计,即使成立的。现在我们把称为样本,参
数的似然函数,是的极大似然估计量。这个称呼是追随费歇尔,因为他在1912年发表的一篇文章中,明确提到以上概念并非针对一般参数的情形。
高斯的第二点创新的想法是:他把问题倒过来,先承认算术平均的估计,然后去找误差密度函数
以迎合这一点,即找这样的
是应取
。
使就是
高斯证明了:这只有在为常数,这就是正态分布
。
条件下才能成立,这里
下面给出正态分布的标准定义:若随机变量X的概率密度为
f x =
x?μ 22??
-∞
其中-∞0为常数,则称X服从参数为μ,?2的正态分布,记为X N(μ,?2)。
X的分布函数为
F x =
+∞
利用 ?∞
1x
?∞+∞
x?μ 2
?
edt
e
?
x22
dx= ?∞f(x)dx=1,事实上
+∞
?∞
f(x)dx=1x
?∞
x?μ 2?
edx
令
x?μ?
=t,则
+∞
?∞
f(x)dx=1x
e
?∞
?
t2dt=
1=1
正态分布密度函数f(x)具有以下几何特性: 1、最大值在x=μ
2、曲线y=f(x)关于直线x=μ对称,于是对于任意h>0,有
P μ?h
3、曲线f(x)在x=μ?σ处有拐点;
4、当x→?∞时,曲线y=f(x)以x轴为渐近线。
另外,当σ固定,改变μ的值,y=f(x)的图形沿Ox轴平移而不改变形状,故μ又称为位置参数。若μ固定,而改变σ的值,y=f(x)的图形的形状随σ的增大而变得平坦。因而σ越小,X落在μ附近的概率越大。
正如许多分布一样,正态分布可以有许多变形,比如说下面将要讨论的正态随机变量函数分布。
设随机变量X N(μ,?2),现考虑Y=aX+b(a≠0)的概率密度fY(y)。
fY(y)=|a|fX(
即有
Y=aX+b N(aμ+b,a?2)
2
1y?ba
e
?
[y?(aμ+b)]2
2a? -∞
特别的,取a=???得
X?μ?
1μ
N(0,1)
通过上面那个式子我们可以将任意一个正态分布转化成标准正态分布,然后通过查标准正态分布表获得概率分布。因此上式为我们提供了求一般正态分布的概率分布的途径。所以正态分布应用方便。
概率分布的平均值与偏离程度是刻画随机变量性质的两类重要数字特征。刻画随机变量性质的数字特征无论是理论上还是实践上都具有十分重要的意义。下面让我们来看看正态分布的数字特征。
首先让我们来看看正态分布的期望:
E X =
令
(x?μ)
?
+∞
x?
1(x?μ)2
?
dx
?∞
=t,便得
E X =
+∞
(?t?∞
+μ)e
?
t22
+∞?
dt?∞?te2
t2
dt+
+∞?∞
e
?
t22
dt=μ
正态分布的数学期望竟然是μ!这多么让人兴奋!看似复杂的分布函数却隐
藏着如此简单的期望值。如果这还不能说明正态分布的奇妙,那让我们再来看看正态分布的方差:
D X =E(X?μ)2=
令
(x?μ)
?
+∞
?
x?μ 2?
μ)2edx
?∞
=t,则有
D X =
+∞2?
te2?∞2
t2
+∞
dt?∞2
e
?
t2
2
dt=?2
这说明正态分布N(μ,?2)中的两个参数μ和σ2分别是正态分布的均值和方差。还可以看出μ和σ2的概率意义和几何意义是相符的。另一方面,表达式如此简单的方差与期望,毫无疑问在揭示着什么。下面我们来看看为什么正态分布这么特殊?
从正态分布的来源我们可以看出正态分布是在研究数据之间的关系中得到的,也就是说正态分布是数据中的规律。
中心极限定理指出,大量相互独立随机变量之和(在每个随机变量对总和的影响都很小的条件下)近似服从正态分布。正因如此,许多随机现象中的随机变量都近似服从正态分布。下面给出独立同分布的中心极限定理及其证明过程。
独立同分布的中心极限定理:设随机变量序列{Xn},n=1,2,?独立同分布,且具有有限的期望和方差,E Xi =μ, D Xi =?2≠0,i=1,2,?,则随机变量
nX?nμYn=i=1i ?
的分布函数Fn(x),对于任意实数x,有
+∞t2 n1X?nμ?
limFn x =lim≤x}= edt n→∞n→∞?∞也即{Xn}服从中心极限定理。
证明 设Ψ(t)为Xi-μ的特征函数,i=1,2,?,考虑到E(Xi-μ)=0,E(Xi?μ)2=D(Xi)=?2,可得Ψ(t)在t=0处展开为
122
Ψt=1??t+ο(t2)
2
Ψ
t2t2
Ψ=1?+ο(
2nnt
n
= nΨn(t),则由独立性知
nn
=[1?+ο()]→e2nnt2
t2
?
t2
2
Ψn t =[Ψ而e
?
t22
(n→∞)
n
正是标准正态分布的特征函数,有特征函数的性质知Yn=
分布函数Ф(x),即对于任意实数x,有
+∞t2 n1i=1Xi?nμ?
limFn x =limP{≤x}= edt n→∞n→∞?∞ X?μ另一方面,林德贝格中心极限定理表明,只要Yn= ni=1Bn
概率意义下均匀的小,则{Xn}服从中心极限定理。所以由大量微小的而且相互独立的随机因素引起并累加而成的量,必将是一个正态随机变量。
所以正态分布是大自然中数据规律的客观存在,自然界是如此美妙,因此正态分布的期望和方差才如此的简单。大量的数据,竟然能够仅仅通过μ和σ两个参数来描述,期间似乎暗示着尽管大自然丰富多彩,但是却可以通过简简单单的数学式子抽象出来,数学如此,物理也如此,这或许就是科学的本质。
科学的发展有一个大趋势,那就是多元化,当人们能处理一个问题的时候总是想通过这个问题解决更多的问题。当人们能够处理一个变量的问题时,以实用为目的和充满探索精神的科学家们就把眼观放在了多个变量的问题上。于是,多维随机变量及其分布的问题就出现了。
由于对于二维随机向量和二维以上的随机向量的讨论没有本质上的差异,所以我们下面主要总结二维正态分布的性质。对于n维情况,所有结论都可以从二维平行地推广。
下面给出二维正态分布的标准定义 若(X,Y)的概率密度为:
x?μ1 2 x?μ1 y?μ2 1 fx,y=?{?[?2ρ12121
1
(y?μ2)2
+]}
2
其中-∞0, σ2>0,-1
边缘分布是联合分布的重要性质,下面对二维正态分布的边缘分布密度进行讨论。
(X,Y)关于X的边缘概率密度为:
fx x =
由于
x?μ1 2
1
?2ρ
x?μ1 y?μ2
12
(y?μ2)2
+
2
+∞
f(x,y)dy
?∞
y?μ2x?μ12(x?μ1)2
2
=[?ρ]+(1?ρ)211
于是
fX x =令t=
1
12y?μ2?2
(x?μ)2
?2?1
+∞
?∞
1y?μx?μ2??ρ][1e2dy
?ρ
x?μ1?1
),则有
+∞
?1
fXx=e
1
(x?μ)22?1
?∞
t2
?
edt
=
11
(x?μ)2?2?1
同理
fY y =
12
(y?μ)2?2?2
可见X N(μ1,σ12),Y (μ2,σ22),即二维正态分布的两个边缘分布都是一维正态分布,并且不依赖于参数ρ。对于给定的μ1,μ2,σ12,σ22,不同的ρ对应不同的二维正态分布,它们的边缘分布却都是一样的。这好像表达了一个二维正态分布是由两个一维正态分布通过参数ρ在一定规则下联合而成的。至于这个“ρ”到底代表什么?ρ与两个一维正态分布究竟是什么关系呢?
对于多维向量,每一个分量都是一维随机变量,既然存在多个变量,那么它们之间就会有关系,下面我们通过协方差和相关系数来分析二维正态分布。
设(X,Y) N(μ1,μ2,σ12,σ22,ρ),下面我们来求其相关系数ρXY
Cov X,Y =E X?μ1 Y?μ2 =
x?μ 2+∞+∞1
x?μ(y?μ)?{?[ 12?∞?∞2 1?ρ ?112(y?μ)?2
2
?2ρ
x?μ y?μ
?1?2
(y?μ)2
2?2
+
]}dxdy
1
=
ρ?
[x?μ1?1(y?μ2)]2?22(1?ρ)?1
?∞(y?μ2)e
+∞
?
dy (x??∞
+∞
μ1dx
令x-μ1=t,得 Cov X,Y =
ρ?1?2
(y?μ2)e?∞
?
+∞
+∞
?
(y?μ2)2
2?2
dy ?∞
?
+∞(y?μ)2
2?2
{2(1?ρ)?[t?exp1
1
(y?μ2)]2}dt
=
2
μ2)2
e
(y?μ)2
?
2?2
ρ?1(y?μ2)2e?∞
2
?
dy=
ρ?1 ?∞(y?
2
?+∞
dy=ρ???22=ρ?1?2
所以
ρXY=
Cov(X,Y) =
ρ?1?2
=ρ 12
ρ的秘密原来藏在这,ρ是二维正态分布两变量的相关系数。同时也正因如此,对于服从二维正态分布的随机向量(X,Y)来说,X与Y不相关与X与Y相互独立是等价的。这又是一个简单的式子,在二维随机变量中,正态分布在继续自己的神奇。
正态分布的性质能不断让人惊叹它的完美,让人惊叹自然界的完美。它应用面广,而且应用方便,它的数字特征那么简易,这就是完美,这是高斯的伟大,也是人类文明进步的标志。
范文四:VB正态分布的例子
VB 正态分布的例子
‘下面是利用VB 生成正态随机数数组的例子。
实现步骤如下:
一、新建一个窗体,加入控件Picture1,Command1
二、复制下面代码到代码编辑区
Option Explicit
Const PI = 3.14159265358
Private Sub Command1_Click()
Dim N, H, X, U1, U2, Ix, i
Picture1.Cls
N = Picture1.ScaleWidth
H = Picture1.ScaleHeight - 10
ReDim a%(N)
Do
U1 = Rnd: U2 = Rnd
If U1 > 0 And U2 > 0 Then
' 产生正态分布随机数 X
X = Sqr(-2 * Log(U1)) * Cos(2 * PI * U2)
'
Ix = Int(X * 20) + N \ 2
If Ix >= 0 And Ix < n="">
a(Ix) = a(Ix) + 1
If a(Ix) > H Then Exit Do
End If
End If
Loop
Picture1.PSet (0, H - a(0))
For i = 1 To N
Picture1.Line -(i, H - a(i)) 'a 为存放正态分布随机数的数组 Next
End Sub
Private Sub Form_Load()
Picture1.AutoRedraw = True
Picture1.ScaleMode = 3
Command1.Caption = "开始生成"
End Sub
三、运行后点击“开始生成”按钮,OK !
范文五:正态分布的概念
统计(2)导学案
课题:正态分布 课型:习题 执笔:韩春冬 审核: 使用时间:
一、学习目标
1、 熟记正态分布密度函数及参数的含义
二、重点难点
1、 正态分布密度函数及参数的含义
2、 正态分布函数的理解
三、学习内容
1、正态分布 概率密度函数为 ?(x
?1x??2
2(?
), x?(-?, ?), ? >0. (1)
如果随机变量X的密度函数是(1)表示的?(x),那么把X叫做服从以?,?为参数的正态分布,记作X?N(?,?2
);如果总体设定的随机变量X服从正态分布,该总体叫做正态总体.对一个确定的正态总体,?,?>0为常数.
特别地,当?=0,?=1时,即X的密度函数是 ?(x
x22
?1
, x?(-?, ?),
此时把X叫做服从标准正态分布,记为X?N(0,1).
标准正态分布的性质:
2、正态分布参数的含义及分布特征 1)
2) 3)
四、探究分析
1、已知正态分布总体所设定的随机变量x的密度函数为 2?2
??x??
1?
?x?32
4
2?
e,x?(-?, ?)
说说这个正态分布总体的主要特征
方法总结:
2、写出下列正态分布的数学期望,方差与标准差
1)
??x??1?
?x?3?2
18
2?
e,x?(-?, ?)
2) ??x??
1?
?x?10?2
60
5
2?
e,x?(-?, ?)
方法总结:
课堂训练
1、下列函数是正态密度函数的是
A. ??x??
22?
e
?
x22
2
B. ??x??
1
?
?x???2e2?2
??,??0?为实数
12?2
C.
??x??
5
e?
?x?10
2?
D.
??x??
1
x2
2
2e
2、关于正态曲线性质的描述:①曲线关于直线x??对称,且在x轴上方 ②曲线最高点坐标
???
?,1?
?2?????
③?越大,曲线越矮胖 ④?越小,曲线越高瘦,上述说法正确的有 3、若随机变量X—N(1,4),且P?x?a??P?x?a?,则a值为
4、某班学生的身高X—N?1.72,0.144?则这班学生的平均身高为 ,方差为 标准差为
5、江苏省09年对口高考成绩X—N?498,2500
?,则平均分为 ,方差为 标准差为
课后作业
1、下图为正态分布曲线,阴影部分①的面积为18,阴影部分②的面积为1
3
,求 1) 求曲线C与X轴所界定区域的面积
2) P?x?a?为多少 3) P?x?b?为多少 4) P?a?x?b?为多少
2、随机变量X—N
??,?2
?的曲线C,已知P?x?a??14,P?x?b??1
3
,求 1) P?x?a? 2) P?x?b? 3) P?a?x?b? 4) P?x?a?,P?x?b?
教学后记