Analyze→Descriptive Statistics→Explore
选择正态性检验项
P>0.05 正态分布
以下两种方法要先对数据进行拆分,正态性检验完毕后,需要撤销拆分
如何拆分:
Data→Split File
撤销拆分
二、单个样本K-S检验
Analyze→Nonparametric Tests→Legacy Dialogs→1-Sample K-S…
P>0.05 正态分布
三、Q-Q图检验
Analyze→Descriptive Statistics→Q-Q Plots
近似围绕直线正态分布
正态性检验方法的比较
兰 州 商 学 院
论 文 题 目:正态性检验方法的比较 学 院、 系:统计学院
专 业 (方 向 ) :社会统计
年 级、 班:
学 生 姓 名:马晓莉
学 号:20080601228
年
正态性检验方法的比较
正态性检验总共有八中检验方法
一. W 检验
W 适用于小样本 (3≤ n ≤ 50) (1) 0
:H 总体服从正态分布
(2)检验统计量为 2
() 12
2
1
1
[()()]()
()
n
i i i n
n
i
i
i i a X X W
a
X
X ===--=
--∑∑∑
(3)检验原理与拒绝域:当原假设为真时, 的值应接近于 1,若 其值过小,则怀疑原假设,从而,拒绝域为
{}R W c =≤
其中,对于给定的 ,有 {}P W c α
≤=查表,可得临界值
二、偏度、峰度检验法: 1、偏度系数 (1) 0
:H
10β=
(2)总体偏度系数 33
13
3
2
2
2
2()
() [() ]E X EX E X EX νβν-==
-
(3)
10β>
总体分布正偏(右长尾) 10β= 总体分布关于 E X 对称 10β
总体分布负偏(左长尾)
样本偏度系数 SK
3
3
2
2() B S B =
2、峰度系数 (1) 0
:H
23β=
(2)峰度系数
44
22
2
2
2()
33()
[() ]
E X EX E X EX νβν-=
-=
--
(3)
20β>
总体分布高峰态
20β= 总体分布正峰态 20β
总体分布低峰态
峰度系数 KU
42
23
()
B K B =
-
三、 Kolmogorov 检验 (1)双侧检验
00
1
:() () :()
()
H F x F x x
H F x F x x
=
?≠? 单侧检验 0010:() () :() () H F x F x x H F x F x x ≥? 0010:()="" ()="" :()="" ()="" h="" f="" x="" f="" x="">?>
H F x F x x
≤?>?
(2)检验统计量: 双侧检验 0sup |() () |n x
D F x F x =-
左侧检验 0sup(() ()) n x
D F x F x +
=-
右侧检验
0sup(() ()) n x
D
F x F x -
=-
实际中,应用统计量
0101max{max(|() () |,|() () |)}n n i i n i i i n
D F x F x F x F x -≤≤=--
称为 Kolmogorov 统计
量
(3) 以双侧检验为例,当 0H 为真时,由格里汶科定理 , n D 的值应较小, 若其值过大,则怀疑原假设 . 从而,拒绝域 {}n R D d => 其中,对于给定的 α
{}n P D d α
>=
又
?{}n n
p P D D =≥ (4) 判断样本所得 是否落入拒绝域,作出结论 . 四 2χ拟合优度检验
(1) 0H :总体 X 的分布函数为 () F X ,即 ~() X
F X
1:
H 总体 X 的分布函数不是 () F X
(2)检验统计量 2
2
2
1
1
()
() k
k
i
i i i i i i i
f f np n
p p n
np χ==-=
-=
∑
∑
:i f 样本中 i A 发生的实际频数 — — (1, 2,... ) i k =观察频数
0:i np H 为真时 i
A 应发生的理论频数 — —
(1, 2,... ) i k =期
望频数
(3)拒绝域 对于给定的 α 令
2
{}P d χα
≥= 则拒绝域为 2
{}R d χ=≥
五、大样本场合 (50≤ n ≤ 1000) 的 D 检验: 1、检验统计量及分布:
0.28209479) 0.02998598
D Y -=
其中
() 1() n
i n i X D +-
=
∑当原假设为真时, 即当总体正态时, ~(0,1),Y
N
但趋于
0的速度比较慢。
0.02998598
() 0.28209479,
E D ≈≈
可见, D 的方差与 n 成反比, n 增大,方差接近于 0,即 D 得取值越来 越集中,即 Y 为 D 的标准变化量。
2、检验原理与拒绝域: 当 0H 为真时 , 0
EY
≈ 说明:50n ≥时 ,||Y 取较大值得可能性很小,若
||Y 较大,则怀疑 0
H 。从而 {||}R Y
d =≥。其中,对于给定的 , α有
12
{||}, P Y d d u α
α-
≥==
六、 克拉姆——冯—米泽斯 (Gramer —— V on —— Miese ) 统计量 (1928年提出的)
()()2
1
() n CM n F x F x dF x =-?????
其中 () F x 为在 0H 成立时,总体的分布函数,及正态分布 2(, ) N μσ的分
布函数(R U
S ==
已知) 。 () n F x 为经验分布函数。
七、 权重式 Gramer —— V on —— Miese 统计量 (WCM ) (1954年提出)
[]
[]
2
1
() () ()
() 1() n
F
x F x W CM n
dF x F x F x -=-?
式中 (). () n F x F x 同六中一样。
八、 David 的统计量(μ) (1954年提出的)
R U
S ==
总的来说:
一、偏度检验对非对称、长尾巴分布较敏感,峰度检验对对称分布较 敏感, W 检验对各种分布,尤其是非对称分布都很敏感。
二、通用的检验方法如 2χ拟合优度检验、 Kolmogorov 检验及 WCM 、 CM 等检验的功效都很低。
三、统计量 μ适合于检验对称短尾的分布。
四、检验功效随样本量的 n 的增加而增大。
五、 样本具有中等或大的容量时, D 检验是一种可行的无方向的正态 性检验方法。
参考文献《正态性检验》作者:梁小筠
正态性检验的一般方法
正态性检验的一般方法
姓名:蓝何忠
学号:1101200203
班号:1012201
正态性检验的一般方法
【摘要】:正态分布是自然界中一种最常见的也是最重要的一种分布.因此,人们在实际使用统计分析时,总是乐于正态假定,但该假定是否成立,牵涉到正态性检验.在一般性的概率统计教科书中,只是把这个问题放在一般性的分布拟合下作简短处理,而这种"万精油"式的检验方法,对正态性检验不具有特效.鉴于此,该文从不同角度出发介绍正态性检验的几种常见的方法,并且就各种方法作了优劣比较,
【引言】一般实际获得的数据,其分布往往未知。在数据分析中,经常要判断一组数据的分布是否来自某一特定的分布,比如对于连续性分布,常判断数据是否来自正态分布,而对于离散分布来说,常判断是否来自二项分布.泊松分布,或判断实际观测与期望数是否一致,然后才运用相应的统计方法进行分析。
几种正态性检验方法的比较。
2?一、拟合优度检验:
(1)当总体分布未知,由样本检验总体分布是否与某一理论分布一致。
H0: 总体X的分布列为p{X=}=,i=1,2,??
H1:总体 X的分布不为.
构造统计量
其中为样本中发生的实际频数
,
论频数。
(2)检验原理 为H0为真时发生的理
2?若=0,则=,意味着对于,观测频数与期望频数完全一致,即完全拟合。
2?观察频数与期望频数越接近,则值越小。 2?当原假设为真时,有大数定理,与不应有较大差异,即值
应较小。
2?若值过大,则怀疑原假设。
2
?拒绝域为R={d} ,判断统计量是否落入拒绝域,得出结论。
二、Kolmogorov-Smirnov正态性检验:
Kolmogorov-Smirnov检验法是检验单一样本是否来自某一特定分布。比如检验一组数据是否为正态分布。它的检验方法是以样本数
据的累积频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。即对于假设检验问题:
H0:样本所来自的总体分布服从某特定分布
H1:样本所来自的总体分布不服从某特定分布
统计原理:Fo(x)表示分布的分布函数,Fn(x)表示一组随机样本的累计概率函数。
,n}{xi?x,i?1,2,?Fn(x)?n#
设D为Fo(x)与Fn(x)差距的最大值,定义如下式:
D=max|Fn(x)-Fo(x)|
对于给定的a,P{Dn>d}=a.
例如:35位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来自均值μ=80,标准差σ=6的正态分布
87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 81 90 84 86 80 68 77 87 76 77 78 92 75 80 78 n=35
检验过程如下:
假设 H0:健康成人男性血糖浓度服从正态分布
H1: 健康成人男性血糖浓度不服从正态分布
计算过程如表:
结论:上表中的理论值(x)是根据标准化值z查表得到,实际上 D=max |Fn(x)-(x)|=0.1754
查D值表,故不能拒绝H0即健康成年男人血糖浓度服从正态分布,当样本容量n大时可以用Dα,n=1.36/求得结果,如上述D0.55, 35=1.36/=0.2299=0.23
结论:当实际观测D>Dn,则接受H1,反之则不拒绝H0假设。
?2拟合优度检验与K-S正态检验的比较:
?2拟合优度检验与K-S正态检验都采用实际频数与期望频数进行检验。它们之间最大的不同在于前者主要用于类别数据,而后者主
要用于有计量单位的连续和定量数据,拟合优度检验虽然也可以用于定量数据,但必须先将数据分组得到实际观测频数,并要求多变量之间独立,而K-S正态检验法可以不分组直接把原始数据的n个观测值进行检验,所以它对数据的利用较完整。
三、Lilliefor正态分布检验
该检验是对Kolmogorov-Smirnov检验的修正,当总体均值和方差未知时,Lilliefor提出用样本均值和标准差代替总体的期望和标准差,然后使用Kolmogorov-Smirnov正态性检验法,它定义了一个D统计量; D=max Fn(x)- Fo(x)|参数未知,由计算得到统计量,查表得Lilliefor检验的临界值,确定拒绝域,得出结论。
四、偏度峰度检验法:
(一)偏度检验:
设随机变量 X 具有数学期望 和方差,为X的偏度,所谓偏度检验就是检验如下假设:
:=0
注意到,拒绝原假设,则可以认为样本不是来自正态总体。接受原
假设,并不等价于接受原假设“样本来自正态总体”。这是因为任一对称分布的偏度都为0,无法排除样本来自非正态的对称分布的可能。因此,偏度检验只能检验数据分布的对称性。
由于总体分布未知,无法直接得到总体的偏度,故可以利用样本偏度作为检验上述假设的检验统计量,记
定义1 设
验的检验统计量为
(*) 为随机变量X的n个相互独立的样本,偏度检
常被用于双尾检验,因为非正态分布可能出现左偏,也可能出
现右偏。在原假设成立时,分位点
,若,在显著性水平下取定
的分布是对,则拒绝原假设。事实上
,
称的,因此采取双尾检验的做法是合理的。
定理1 设为(*)式中定义的偏度检验统计量,则渐进服从均值为 0,方差为6的正态分布,即
样本容量有限的情形,使用渐进情形下的结论就会导致较高的出错率,这也是偏度检验的一个缺陷。需要指出的是,只有在确定对称性是唯一影响分布的形态时,偏度检验才是合适的选择,否则应该避免使用偏度检验。
(二)峰度检验
设随机变量 X
具有数学期望
和方差
,为 X 的峰度,所谓峰度检验,实际上是将正态性检验转化为检验如下假设:
如同偏度检验一样,峰度为 3 的非正态分布也是存在的。所以,接受原假设并不能表明 X 一定服从正态分布,这一事实也导致对
数据的正态性检验会有一定的出错率。
定义2 设
检验的检验统计量为
为随机变量X的n个相互独立的样本,峰度
(*2)
定理 2设为(*2)式中定义的峰度统计量,则
同偏度统计量一样,的收敛速度也是比较慢的.
五、小样本场合(3
w检验是检验样本容量n ≤50时,样本是否符合正态分布的一种方法。其检验步骤如下:
①将数据按数值大小重新排列,使x1≤x2≤?≤xn; ②计算 (X?
i?1ni?)2
③计算 式中:当n为偶数时,i=n/2;n为奇数时,i=(n-
1)/2; 值可查表得出;
④计算检验统计量
[ni?1W?[ai(X(n?1?i)?X(i))]2
?(X
i?1ni?)2
⑤若W值小于判断界限值Wα(可通过查表求得),按表上行写明的显著性水平α舍弃正态性假设;若W>Wα,接受正态性假设。
六、大样本场合(50
检验统计量:
D??(i?nn?1)X(i)再令
则在显著性水平时,拒绝域为
分别为Y的和分位数。 。其中
总结
在各种正态性检验方法中,一般通用的方法有?检验以及K检验,但检验精度较低。 偏度检验对非对称、长尾分布较敏感;峰度检验对对称分布较敏感;W 检验对各种分布(特别对非对称分布)都很敏感。当总体均值和方差未知且无先验信息时用Lilliefor正态检验.大样本情况下D检验是比较好的检验方法。但我们要知道,检验方法的功效性都是随着样本量的增大而增大的。 2
正态性检验方法的比较
11统计1 201130980122 温汶琪
正态性检验方法
正态分布是许多检验的基础,比如F检验,t检验,卡方检验等在总体不是正态分布是没有任何意义。因此,对一个样本是否来自正态总体的检验是至关重要的。当然,我们无法证明某个数据的确来自正态总体,但如果使用效率高的检验还无法否认总体是正态的检验,我们就没有理由否认那些和正态分布有关的检验有意义。 一. W检验
W适用于小样本 (3≤n≤50) (1)H0:总体服从正态分布
[?(ai?)(X(i)?)]2
i?1n
(2)检验统计量为W?
?(a?)?(X
2
i
i?1
i?1
nn
i
?)2
(3)检验原理与拒绝域:当原假设为真时, 的值应接近于1,若其值过小,则怀疑原假设,从而,拒绝域为 R?{W?c} 其中,对于给定的 ,有
P{W?c}??查表,可得临界值 二、偏度、峰度检验法: 1、偏度系数 (1)H0:?1?0 (2)总体偏度系数?1?
?3
(?2)
32
?
E(X?EX)3[E(X?EX)]
322
(3) ?1?0 总体分布正偏(右长尾)
?1?0 总体分布关于EX对称 ?1?0 总体分布负偏(左长尾)
样本偏度系数SK
S?
B3(B2)
32
2、峰度系数 (1)H0:?2?3 (2)峰度系数
?4E(X?EX)4
?2??3??3
(?2)2[E(X?EX)2]2
(3) ?2?0 总体分布高峰态
?2?0 总体分布正峰态 ?2?0 总体分布低峰态
峰度系数KU K?三、Kolmogorov检验
B4
?3 (B2)2
)0F(x)?x(1)双侧检验 H0:F(x?
1
H:F(?x)
F(?) x
x
单侧检验 H0:F(x)?F0(x)?x H0:F(x)?F0(x)?x(2)检验统计量:
|nx(?)0Fx()| 双侧检验 D?supF
x
H1:F(x)?F0(x)?x H1:F(x)?F0(x)?x
左侧检验 D??supF (x(?)nFx())0
x
右侧检验 D??supF (x(?)0Fx())n
x
实际中,应用统计量
Dn?max{max(|Fn(xi)?F0(xi)|,|Fn(xi?1)?F0(xi)|)} 称为Kolmogorov统计
1?i?n
量
(3) 以双侧检验为例,当H0为真时,由格里汶科定理,Dn的值应较小,若其值过大,则怀疑原假设. 从而,拒绝域 R?{Dn?d} 其中,对于给定的? P{Dn?d}??
?} 又 p?P{Dn?Dn
(4) 判断样本所得 是否落入拒绝域,作出结论. 四?2拟合优度检验
(1)H0:总体X的分布函数为F(X),即X~F(X)
H1:总体X的分布函数不是F(X)
(2)检验统计量 ???
2
i?1
k
k
(fi?npi)2nfi2
(?pi)?? pinnpii?1
fi:样本中Ai发生的实际频数(i?1,2,...k)——观察频数 npi:H0为真时Ai应发生的理论频数(i?1,2,...期k——)望频数
(3)拒绝域 对于给定的?
令 P{?2?d}?? 则拒绝域为 R?{?2?d} 五、大样本场合(50≤n≤1000)的 D 检验: 1、检验统计量及分布:
Y?
D?0.28209479)
0.02998598
其中
D?
?(i?
n
n?1
)X(i) N(0,1),但趋于0的速度比较慢。
当原假设为真时,即当总体正态时, Y~
E(D)?0.28209479,?
可见,D的方差与n成反比,n增大,方差接近于0,即D得取值越来越集中,即Y为D的标准变化量。 2、检验原理与拒绝域:
当H0为真时,EY?0 说明:n?50时 ,|Y|取较大值得可能性很小,若
|Y|较大,则怀疑H0。从而R?{|Y?|d}。其中,对于给定的?,有
P{|Y?|d}??
,d??u
1?2
六、克拉姆——冯—米泽斯(Gramer——Von——Miese)统计量(1928年提出的)
CM?n???Fn?x??F?x???dF(x)
1
2
其中F(x)为在H0成立时,总体的分布函数,及正态分布N(?,?2)的分
布函数(U?
R
?S
。Fn(x)为经验分布函数。
七、权重式Gramer——Von——Miese统计量(WCM)(1954年提出)
?F(x)?F(x)? WCM?n
1
n
2
F(x)1?F(x)dF(x)
式中F(x).Fn(x)同六中一样。
八、David的统计量(?)(1954年提出的)
U?
R
?S
总的来说:
一、偏度检验对非对称、长尾巴分布较敏感,峰度检验对对称分布较敏感,W检验对各种分布,尤其是非对称分布都很敏感。
二、通用的检验方法如?2拟合优度检验、Kolmogorov检验及WCM、CM等检验的功效都很低。
三、统计量?适合于检验对称短尾的分布。 四、检验功效随样本量的n的增加而增大。
五、样本具有中等或大的容量时,D检验是一种可行的无方向的正态性检验方法。
参考文献百度文库《正态性检验》
正态性检验的几种常用的方法
正态性检验的几种常用的方法
0引言
正态分布是自然界中一种最常见和最重要的一种分布.以正态总体为前提的统计方法也已经被越来越多的教学、科研工作者所掌握.但是,在一个实际问题中,总体一定是正态总体吗,如果不顾这个前提是否成立,盲目套用公式,可能影响统计方法的效果,因此,正态性检验是统计方法应用中的重要问题.
但一般的数理统计教材中,关于正态性检验方法只介绍/拟合优度检验,但该方法不仅对正态分布且对其他分布也适用,对正态性检验不具有特效.本文在查阅了该问题的大量文献的基础上,结合正态分布的特点介绍了几种常见的正态性检验方法,并对各种方法的优劣点作了简要介绍.
本文的结构安排如下,第一部分介绍了正态分布的一些基本知识,第二部分首先介绍定性的正态性检验:利用概率纸检验,其次简要介绍/拟合优度检验;再次介绍了正态性检验的特效方法:W检验与D检验,最后介绍有方向性的正态性检验:峰度检验与偏度检验.第三部分简要地比较了各种检验法的优劣性.
1正态分布的基本知识
1.1正态分布的概念
定义1若随机变量X的密度函数为
另我们称p=0,a=1的正态分布为标准正态分布,记为X?N(0,1),标准正态分布随机变量的密度函数和分布函数分别用<p(x)和x)表示.
由引理可知,任何正态分布都可以通过标准正态分布表示.
若X~N(p,,a2),则3=0,3k=3若随机变量的分布函数F(x)可表示为:
F(x)=(1-s)Fj(x)+sF2(x)(0彡s<1)(8)
其中(x)为正态分布Nijx,a\)的分布函数,F2(x)为正态分布N、jx,a2)的分布函数,则称X的分布为混合正态分布.
引理5混合正态分布的峰度氏>3.
注:引理1、2、3、的证明见参考文献1和引理5的证明见参考文献M.
2几种常见的正态性检验方法
2.1利用概率纸检验分布的正态性
2.1.1正态概率纸的构造
正态概率纸是一种具有特殊刻度的坐标纸,它能使由正态变量的取值x和相应的分布函数值F(x)组成的数对(x,F(x))在这张纸上呈一条直线.因此,它计算使用简单方便.关于利用概率纸检验分布的正态性的原理,由于篇幅有限,不便阐述,见参考文献2].
下面重点介绍利用概率纸检验总体正态性假设的一般步骤:
1)把从总体中获得的n个样本观测值按由小到大的次序排列成:x(0(2)忘?忘xw
2)将数(x(l),n /4)(i=1,2,??,n)画在正态概率纸上
3)观察这n个点的位置,进行判断.
如果这些点明显地不成一条直线,则拒绝总体正态性的假设;
如果各点离直线的偏差都不大,可以认为总体近似服从正态分布.
这时可以凭直觉画一条直线,使它离各点的偏离程度尽可能的小,
其中在纵轴刻度为50%附近各点离直线的偏差要优先照顾,使其尽可能的小,并且使直线两边的点数大致相等.另外,若发现有些点系统地偏离直线,在拒绝总体正态性假设后,可以考虑其他分布类型.特别地,如果几个较大的值明显地倾向于由其他值确定的直线的下方,考虑函数变换y=log(x)或y=槡x后,总体是否服从正态分布.同时,利用概率纸还可以估计正态分布的参数,和a.虽然不够精确,但十分简便.
2.1.2正态概率纸法的应用
例1对某种高温合金钢的15个试样在580?C的温度和15.5kg/mm2的压力下进行试验,其断裂时间为t(单位:小时),表1给出了按由小到大的次序排列的xw,及对数变化下的值lg(10x(4))(k=1,2,??,15),试用正态
概率纸法分析高温合金钢的寿命分布.
解将这15个结果值分别同和丨8(10k))组成点分别画在两张正
态概率纸上,来检查这组
结果值是否构成一条直线,是否服从正态分布(见图1).
图1的左图是由(x(k),所呈现的结果,可以看见这些点不成一条直线.图1的右图是由(x(k),lg
(10x(k)))所呈现的结果,可以看到这些点明显接近一条直线,所以说这些观测值的对数为正态分布的假设是适当的.
利用概率纸检验分布的正态性,靠的是人的视觉,主观性较强,所以检验的方法必须由定性的转为定量的.下面介绍几种定量的检验文献1].以上的/拟合优度检验法不仅适用于正态性检验,还适用于其他分布的检验,对正态性检验来说不具有特效型,下面介绍两种只针对总体正态性假设的检验:W检验与D检验(
2(3W检验与D检验
2.3.1W检验
2.3.1.1W检验的一般步骤
W检验是S.S.Shapiro在1965年提出,检验的基本步骤如下:
1)建立原假设H:X服从正态分布;2)把从总体中获得的n个样本观测值按由小到大的次序排列成:x(1)(2)忘?忘xw
3)选择恰当的统计量W为:
其中b/2]表示n/2的整数部分;系数A(W)可查W检验的系数表,
Xx(.)-x]2i=1
n/2]表示数n/2的整数部分.
4)根据给定的检验水平a和样本容量n查W检验统计量W的p分位数得统计量W的a分位数Wa.
5)计算并判断:给定样本值x1,??,x?,计算W并与Wa比较,若W<Wa,则拒绝札,反之,则不能拒绝
注:有关W检验的原理及W检验的系数及分位数表见参考文献5].
2.3.1.2W检验的应用
例2抽查用克矽平治疗的矽肺患者10名,得他们治疗前后血红蛋白的差(单位:克,)如下:2.7,-1.2,-1.0,0,0.7,
2.0,3.7,-0.6,0.8,-0.3,
试用W检验检验治疗前后血红蛋白的差是否服从正态分布(
解把例2中的数据按由小到大的次序排好填入表2
把表2的数据代入公式疋=」--n=,经计算得疋=0.9251.
.Xx(.)-x]2
I=1
若取a=0.05,查统计量W的a分位数表得n=10时,Wa=0.842,因为W>Wa,所以不拒绝原假设.虽然W检验是一种有效地正态性检验方法,但它一般只适用于容量为3至50的样本,随着n的增大,一般用于计算分位数的分布拟合的技术不能使用.
2.3.2D检验
1971年,D.Agostino提出了D检验,该检验不需要附系数表,另外,它适用于的样本容量n的范围为:50耷n耷1000.D检验的基本步骤如下:
1)建立原假设H:X服从正态分布;
2)把从总体中获得的n个样本观测值按由小到大的次序排列成:x(1)(2)Hxu)
3)选择恰当的统计量Y为:
4)根据给定的检验水平a和样本容量n查D检验统计量Y的p分位数,得统计量Y的a/2分位数Ya/2和1-a/2分位数
5)计算并判断:给定样本值x1,??,x?计算y并与及Y1_f比较,若Y<Ff,或Y>Y1_f则拒绝札,反之,则不能拒绝H.
注:有关D检验的原理及D检验的分位数表见参考文献6].
以上两种检验需要提供分位数表及统计量的计算较为繁琐,下面介绍另外两种正态性检验的方法:偏度检验与峰度检验(
2.4偏度检验与峰度检验2(4(1偏度检验
设x〖,??,xn为来自总体X的一组样本,由引理4知,若X服从正态分布,则偏度为0.若有一组数据x〖,
?,x?,观察发现数据有正偏度或负偏度的倾向,就在偏度方向产生了对正态性假设的怀疑.因此,把总体正态性检验转化成原假设札:3s=0的检验.偏度检验的一般步骤如下:
1)根据实际问题中的先验信息建立原假设札:
3=0与备择假设H:3s>0,或H:3<0
n
VnX(xi-x)3
2)选择恰当的偏度统计量bs为:bs=^z(9)
{i-x]2}T
3)根据给定的检验水平a和样本容量n查偏度统计量\的p分位数表,得统计量\的1-a分位数\(1-a)
4)计算并判断:给定样本值x1,?,x?,计算&并与&(1-a)比较,作出判断:
?当备择假设为H1:3>0时,若bs>bs(1-a)则拒绝H,反之,则不能拒绝H;
?当备择假设为H:3s<0时,若bs<-bs(1-a)则拒绝H,反之,则不能拒绝H.
在进行偏度检验时,备择假设不同,判断的准则也不同.因而“具有总体在偏度方向上偏离正态,并且有明确的偏度方向”是偏度
检验的使用条件.
{i-xi2}2
3)根据给定的检验水平a和样本容量n查偏度统计量b的p分位数表,得统计量b的1-a分位数h(1-a)或a分位数\(a).
4)计算并判断:给定样本值x1,?,x?,计算\并与\(1-a),bk(a)比较,作出判断:
?当备择假设为H1:3k>3时,若bk>bk(1-a)则拒绝H,反之,则不能拒绝H.
?当备择假设为H:3k<3时,若bk<bk(a)则拒绝H,反之,则不能拒绝H.
注:1)在进行峰度检验时,备择假设不同,判断的准则也不同.因而“具有总体在峰度方向上偏离正态,并且有明确的偏度方向”是偏度检验的使用条件.
2)有关偏度检验、峰度检验的原理及统计量\、bk的p分位数表见参考文献7].
1.4.2.2峰度检验的应用
例3某人怀疑测量过程受到干扰,因而又测量了40个同类零件的同一尺寸,测得与理论值的偏差见
表3(
解如果测量不受干扰,测量的偏差服从正态分布N(/x,a2),对测量过程的干扰可能是均值相同、方差增大的正态分布
N(/x,a2)(a2>a1).测量偏差服从混合正态分布,混合正态分布的
定义见定义4,由引理5知测量偏差的分布的峰度3>3,因此给出备择假设为圮:3k>3,把表3的数据代入公式(10),其中n=40;经计算得\=4.96,取检验水平a=0.05,查\的p分位数表得\(0.95)=4.06,因为4.96>4.06,因而拒绝原假设,认为总体为峰度大于3的分布.
3结束语
正态分布,称为有方向的检验.如果实际问题中不具备该信息,则无法使用该方法来检验.因此,我们在使用以上方法进行正态性检验时一定要注意具体问题中所包含的信息,从中适宜的检验方法(