一.几个重要统计量的分布 二.均值向量的检验 三.协差阵的检验
χ2
以 做检验。
2012-04-26
1
目录 上页 下页 返回 结束
2
一、 χ 分布与Wishart分布
2
§3.1 常用分布及抽样分布
一、 χ 2分布与Wishart分布 二、 t 分布与 T 分布
2
在数理统计中,若 X i ~ N (0,1) ( i = 1, 2, , n ),且相互独立, 2 则 ∑ X 所服从的分布为自由度为 n 的 χ 分布(chi squared
n
distribution),记为 χ 2 (n) .
i =1
2 i
χ 2 (n) 分布有两个重要的性质:
2 2 1、若 χ i ~ χ (ni ), i = 1, 2,
三、 F 中心分布与Wilks分布
, k 且相互独立,则
∑χ
i =1
k
2 i
~ χ 2 (∑ ni )
i =1
k
称为相互独立 χ 的具有可加性.
2
3
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
4
一、 χ 分布与Wishart分布
2
一、 χ 分布与Wishart分布
2
2. 设 X i ~ N (0,1) ( i = 1, 2, , n ),且相互独立, Aj ( j = 1, 2, , m) 为 m个 n 阶对称阵,且 ∑ A
j =1 m j
= I n(n阶单位阵),记 X = ( X , X , 1 2
, X n )′ ,
定义1 设 X (α ) = ( X α 1 , X α 2 , , X α p )′ (α = 1, 2, , n) 相互独立, 且 X (α ) ~ N p ( μα , ∑) ,记 X = ( X(1) , X(2) , , X(n) )′ ,则随机矩阵:
W = X ′X = ∑ X(α ) X(′α )
α =1
n
Q j = X ′A j X , 则 Q1 , Q2 ,
m j =1
, Qm为相互独立的 χ 2分布的充要条件
2
(1.1)
为 ∑ rank(Ai ) = n .此时 Q j ~ χ ( n j ) , n j = rank(A j ) . 这个性质称为Cochran定理,在方差分析和回归分析 中起着重要作用.
所服从的分布称为自由度为 n 的 p 维非中心Wishart 分布,记为W ~ Wp (n, ∑, Z ) , 其中,n ≥ p, ∑ > 0,Z = ∑ ( μα , μα , , μα )′ ( μα , μα , , μα ) = ∑ μα μα ,μα α α 称为非中心参数,当 μα = 0 时称为中心Wishart分布,记为
n n ' =1 1 2 p 1 2 p =1
W p (n, ∑)
5
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
6
一、 χ 分布与Wishart分布
2
一、 χ 分布与Wishart分布
2
由Wishart分布的定义知,当 p = 1 时, ∑ 退化为 σ 2,此时中 心Wishart分布就退化为 σ 2 χ 2 (n),由此可以看出, Wishart分布 实际上是 χ 2分布在多维正态情形下的推广. 下面给出Wishart分布的5条重要性质: 1.若 X (α ) = ( X α 1 , X α 2 , , X α p )′, (α = 1, 2, , n )是从 p 维正态总体
N p ( μ , ∑ ) 中抽取的 个随机样本,X为样本均值, 样本离差阵为 .
2.若 Wi ~ W p ( ni , ∑) ( i = 1, 2, , k ) 且相互独立,则
∑W
i =1
k
i
? k ? ~ W p ? ∑ ni , ∑ ? ? i =1 ?
3.若 W ~ W p ( n, ∑ ) , C 为非奇异阵,则 q× p
CWC ′ ~ Wq (n, C ∑ C ′)
n
S = ∑( X(α ) ? X )( X(α ) ? X )′,
α =1
n
则
(1) X 和 (2)
S 相互独立.
4.若 W ~ W p (n, ∑ ) , 则
a′Wa a′∑ a
a 为任一 p 元常向量,满足 a′ ∑ a ≠ 0
X ~ N p ( μ , 1 ∑ ) , S ~ Wp (n ? 1, ∑) n
7
目录 上页 下页 返回 结束
~ χ 2 ( n)
8
目录 上页 下页 返回 结束
一、 χ 分布与Wishart分布
2
二、t 分布与 T 2分布
在数理统计中,若 X ~ N (0,1),Y ~ χ 2 (n) ,且 X 与 Y 相互独立,则称
T=
X
Y n
5. 若 W ~ W p (n, ∑), a 为任一 p 元非零常向量,比值
a ′∑ ?1 a a ′W ?1a
~ χ ( n ? p + 1)
2
?1
服从自由度为 n 的
t 分布,又称为学生氏分布(student
2
特别的,设wii和 σ ii分别为 W 和 ∑ 的第 i 个对角元,则:
?1
2 distribution),记为 T ~ t(n) .如果将 T 平方,即 T 2 = n XY ,则 T ~ F(1, n),
σ ii
wii
~ χ (n ? p + 1)
2
即 t (n) 分布的平方服从第一自由度为1第二自由度为 n 的中心 F 分布.
9
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
10
二、t 分布与 T 2分布
定义2 设 W ~ W p ( n, ∑) , X ~ Np (0, c∑) , c > 0, n ≥ p,∑ > 0, W与 X 相互独立,则称随机变量
三、 F 中心分布与Wilks分布
在数理统计中,若 X ~ χ 2 (m) ,Y ~ χ 2 (n) ,且相互独
T 2 = n X ′W ?1 X c
所服从的分布称为第一自由度为 p 第二自由度为 n 的中 心T 2 分布,记为 T2 ~T2( p, n) 中心 T 2分布可化为中心 F 分布,其关系为:
n?p+1 pn
F = m 所服从的分布为第一自由度为 m第二 Y n 自由度为 n 的中心 F 分布.记为 F ~ F(m, n) . F 分布本
立,则称
2 质上是从正态总体 N ( μ , σ ) 随机抽取的两个样本方差
X
T2 ( p, n) = F( p, n ? p +1)
的比.
显然,当 p = 1 时,有 T 2 (1, n) = F (1, n).
11
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
12
三、 F 中心分布与Wilks分布
定义3 设 W1 ~ Wp (n1 , ∑) , W ~Wp(n2,∑) , ∑ > 0 , n1 > p, 2 且 W1 与 W2 相互独立,则称随机变量
三、 F 中心分布与Wilks分布
由于Λ分布在多元统计中的重要性,关于它的近似 分布和精确分布不断有学者进行研究,当p和n2中的一个 比较小时,Λ分布可化为F分布,表1列举了常见的情况. 表1
Λ ~ Λ( p, n1 , n2 )与F的关系,n1 > p
Λ =
W1 W1 +W
2
所服从的分布称为维数为 p ,第一自由度为 n1第二 自由度为
n2 的Wilks Λ分布,记为
Λ ~ Λ ( p, n1 , n2 )
13
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
14
三、 F 中心分布与Wilks分布
当 p, n2不属于表1情况时, Bartlett指出可用 χ 分布来近似表示,即
2
三、 F 中心分布与Wilks分布
近似服从 F ( pn2 , ts ? 2λ ),其中
V = ?(n1 + n2 ?
近似服从χ ( pn2 ) .
2
p + n2 +1 2
) ln Λ( p, n1 , n2 )
Rao 后来又研究用F分布来近似,即
R=
1? Λ s ts ? 2 λ 1 pn 2 Λs
1
?t = n1 + n2 ? ? 2 ? p 2 n2 ? 4 ? s = p2 + n22 ?5 ? ?λ = pn24? 2 ?
p + n2 +1 2
ts ? 2λ 不一定是整数,用与它最近的整数来作为 F分布的第二自由度.
15 16
目录 上页 下页 返回 结束
目录
上页
下页
返回
结束
§3.2
均值向量的检验
一、 一个指标检验的回顾
一、 二、 三、 四、
一个指标检验的回顾 多元均值检验 两总体均值的比较 多总体均值的检验
u= x ? μ0
σ
n
n
(1)
1 其中x = ∑ xi为样本均值。 n i =1 当假设成立时, 统计量u服从正态分布u ~ N (0,1), 从而拒绝域为 | u |?ua / 2 , ua / 2为N (0,1)的上a / 2分位点
17
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
18
一、 一个指标检验的回顾
当σ 2未知时, 用S 2 = ∑ t= x ? μ0 n S ( xi ? x )2 作为σ 2的估计, 用统计量 i =1 ( n ? 1)
n
一、 一个指标检验的回顾
统计量(2)也可改写成如下形式
t 2 = n ( x ? μ 0 )( S 2 ) ?1 ( x ? μ 0 )
(2)
当假设为真时,统计量t2遵从第一自由度为1、第二自 由度为n-1的F分布,记为t2~F(1,n-1),其拒绝域为
来做检验。当假设成立时,t统计量遵从自由度为n-1的 t分布,t~t(n-1),拒绝域为 | t |> tα / 2 (n ? 1),
tα / 2 (n ? 1)为t (n ? 1)的上α / 2分为点。
t2>Fα(1,n-1).
19
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
20
二、 多元均值检验
二、 多元均值检验
α
α α
21
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
22
二、 多元均值检验
设 X (1) , X (2) , 本,且 X =
二、 多元均值检验
(二)协差阵 Σ 未知时均值向量的检验 H 0:μ = μ 0 ( μ 0 为已知向量) H1:μ ≠ μ 0 假设 H 0 成立,检验统计量为
, X ( n ) 是 来 自 p 维 正 态 总体 N p ( μ , Σ ) 的 样
n n
1 ∑ X (α ) , S = ∑ ( X ( a ) ? X )( X ( a ) ? X )′ 。 n α =1 a=1 (一) 协差阵 Σ 已知时均值向量的检验 H 0:μ = μ0 ( μ0 为已知向量) H1:μ ≠ μ0 假设 H 0 成立,检验统计量为
T02 = n( X ? μ0 )′ Σ ?1 ( X ? μ0 ) ~ χ 2 ( p )
2
(n ? 1) ? p + 1 2 T ~ F ( p, n ? p ) (n ? 1) p 2 ?1 其中, T = (n ? 1)[ n ( X ? μ 0 )′S n ( X ? μ 0 )]
? n? p 2 ? T > Fα ? = α ,可 ? (n ? 1) p ? n? p 2 2 T > Fα , 确定出临界值 Fα ,再用样本值计算出 T ,若 (n ? 1) p 则否定 H 0 ,否则接受 H 0 。
给定检验水平 α ,查 F 分布表,使 P ?
24
目录 上页 下页 返回 结束
给定检验水平 α , χ 分布表使 P T0 > 查
2
2 2 2
{
2 χα } = α ,可确定出
2
临界值 χα ,再用样本值计算出 T0 ,若 T0 > χα ,则否定 H 0 , 否则接受 H 0 。
23
目录 上页 下页 返回 结束
三、 两总体均值的比较
在许多实际问题中,往往要比较两个总体之间的 平均水平有无差异。例如,两所大学新生录取成绩是 否有明显差异;研究职工工资总额的构成情况,若按 国民经济行业分组,例如要研究工业与建筑业这两个 行业之间,是否有明显的不同之处;同理,可按工业 领导关系(中央、省、市、县属工业)分组;也可按 工业行业分组。组与组之间的工资总额构成有无显著 差异,本质上就是两个总体的均值向量是否相等,这 类问题,通常也称为两样本问题。两总体均值比较的 问题,又可分为两总体协方差阵相等与两总体协方差 阵不等两种情形。
25
目录 上页 下页 返回 结束
三、 两总体均值的比较
(一)当协差阵相等时,两个正态总体均值向量的检验 设 X ( a ) = ( X a1 , X a 2 , , X ap )′ , = 1,2, , n , 为来自 p 维 a 正 态 总 体 N p (μ1 , Σ) 的 容 量 为 n 的 样 本 ;
Y( a ) = (Ya1 , Ya 2 ,
, Yap )′ , a = 1,2,
, m ,为来自 p 维正
态总体 N p (μ 2 , Σ) 的容量为 m 的样本。两组样本相互独 立, n > p, m > p ,且 X =
1 n 1 m ∑ X(i ) , Y = m ∑ Y(i ) 。 n i =1 i =1
26
目录 上页 下页 返回 结束
三、 两总体均值的比较
1.针对有共同已知协差阵的情形 对假设
三、 两总体均值的比较
2.针对有共同的未知协差阵的情形 对假设
H 0:μ1 = μ 2
H1:μ1 ≠ μ 2
进行检验。 对此问题,假设 H 0 成立时,所构造的检验统计量为
H 0:μ1 = μ 2
H1:μ1 ≠ μ 2
n?m ( X ? Y )′Σ ?1 ( X ? Y ) ~ χ 2 ( p) n+m 2 2 2 给出检验水平 α ,查 χ ( p ) 分布表使 P {T0 > χα } = α ,可 T02 =
确定出临界值 χα ,再用样本值计算出 T0 ,若 T0 > χα ,则
2 2 2 2
进行检验。 对此问题,假设 H 0 成立时,所构造的检验统计量为
F=
( n + m ? 2) ? p + 1 2 T ~ F ( p, n + m ? p ? 1) (n + m ? 2) p
其中,
否定 H 0 ,否则接受 H 0 。
27
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
28
三、 两总体均值的比较
? n?m ?′ ? n?m ? T 2 = ( n + m ? 2) ? ( X ? Y ) ? S ?1 ? ( X ? Y) ? n+m n+m ? ? ? ? S = Sx + S y
S x = ∑ ( X ( a ) ? X)( X ( a ) ? X)′ , S y = ∑ ( Y( a ) ? Y)( Y( a ) ? Y )′ ,
a=1 a=1 n n
三、 两总体均值的比较
(二)协差阵不等时,两个正态总体均值向量的检验 设从两个总体 N p (μ1 , Σ1 ) 和 N p (μ 2 , Σ 2 ) 中,分别抽取两 个样本,即 X ( a ) = ( X a1 , X a 2 ,
, X ap )′ , a = 1,2,
,n ;
X = ( X1 , X2 ,
Y = (Y1 , Y2 ,
, X p )′
, Yp )′
Y( a ) = ( Ya1 , Ya 2 ,
, Yap )′ ,a = 1,2,
, m ,其容量分别为
给定检验水平 α ,查 F 分布表,使 p { F > Fα } = α ,可确定 出临界值 Fα ,再用样本值计算出 F ,若 F > Fα ,则否定 H 0 , 否则接受 H 0 。
29
目录 上页 下页 返回 结束
n 和 m ,且两组样本相互独立, n > p, m > p , Σ1 > 0 , Σ 2 > 0 。对假设 H 0:μ1 = μ 2 H1:μ1 ≠ μ 2
进行检验。
30
目录 上页 下页 返回 结束
三、 两总体均值的比较
1.针对 n = m 的情形 Z (i ) = X (i ) ? Y(i ) 令
三、 两总体均值的比较
i = 1,2,
,n
2.针对 n ≠ m 的情形 在此,我们不妨假设 n < m="">
1 n Z = ∑ Z (i ) = X ? Y n i =1 S = ∑ (Z (i ) ? Z)(Z (i ) ? Z)′ = ∑ ( X(i ) ? Y( i ) ? X + Y)( X(i ) ? Y( i ) ? X + Y)′
i=1 i=1 n n
Z(i ) = X(i ) ?
n n 1 1 m Y(i ) + ∑ Y(i ) ? m ∑ Y(i ) m n ? m j =1 j =1
假设 H 0 成立时,构造检验统计量为
i = 1,2, , n 1 n Z = ∑ Z (i ) = X ? Y n i =1
F=
(n ? p)n Z′S -1Z ~ F ( p, n ? p ) p
31
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
32
三、 两总体均值的比较
S = ∑ (Z(i ) ? Z)(Z(i ) ? Z)′
i=1
n ? ? n 1 n = ∑ ? ( X ( i ) ? X) ? (Y(i ) ? ∑ Y( j ) ) ? m n j =1 i =1 ? ?
四、 多总体均值的检验
在许多实际问题中,我们要研究的总体往往 不止两个。例如,要对全国的工业行业的生产经 营状况做一比较时,一个行业可以看成一个总 体,此时要研究的总体就达几十甚至几百个之多。 这类问题的研究就需要多元方差分析的知识。多 元方差分析是一元方差分析的直接推广,为了易 于理解多元方差分析的方法,我们先回顾一元的 方差分析。
n
? ?′ n 1 n ? ? ( X ( i ) ? X) ? (Y(i ) ? ∑ Y( j ) ) ? m n j =1 ? ?
假设 H 0 成立时,构造检验统计量为
F=
(n ? p ) n Z′S -1Z ~ F ( p, n ? p) p
33
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
34
四、 多总体均值的检验
(一)单因素方差分析的基本思想 设 k 个正态总体分别为 N ( μ1 , σ ) ,
2
四、 多总体均值的检验
2
, N ( μ k , σ ) ,从 k 个总
这里 SSA =
∑ n (X
i =1 i
k
i
? X )2 称为组间平方和; SSE = ∑∑ ( X (j i ) ? X i ) 2
i =1 j =1
k
ni
体取 ni 个独立样本如下:
(1) (1) X 1(1) , X 2 , , X n1 …… ( ( X 1( k ) , X 2k ) , , X nkk )
称为组内平方和; SST =
∑∑ ( X
i =1 j =1
k
ni
(i ) j
? X ) 称为总平方和。其中
2
Xi = X=
1 ni
∑X
j =1
n
(i ) j
H 0:μ1 = μ 2 =
= μk
H1:至少存在i ≠ j使μi ≠ μ j
假设 H 0 成立时,构造检验统计量为
1 k ni (i ) ∑∑ X j n i =1 j =1
n = n1 +
+ nk
F=
SSA (k ? 1) ~ F (k ? 1, n ? k ) SSE (n ? k )
35
目录 上页 下页 返回 结束
给定检验水平 α , F 分布表, p { F > Fα } = α , 查 使 可确定出临界值 Fα , 再用样本值计算出 F 值,若 F > Fα ,则否定 H 0 ,否则接受 H 0 。
36
目录 上页 下页 返回 结束
四、 多总体均值的检验
(二)多元方差分析法 设有 k 个 p 维正态总体 N p (μ1 , Σ) , 体抽取独立样本个数分别为 n1 , n 2 , 第一个总体: X
(1) i
四、 多总体均值的检验
各总体样品的均值向量:
(r X1× )p =
, N p (μ k , Σ) ,从每个总
, nk , n1 +
(1) ip
+ nk = n ,每
此处
1 nr
∑X
i =1
nr
(r ) (i )
( ?( X1r ) , X (2r ) ,
, X (pr ) ) , r = 1, 2,
,k
个样品观测 p 个指标得观测数据如下:
X(jr ) =
k
= (X , X ,
(1) i1 (1) i2
, X ) , i = 1,2,
(2) , X ip ) , i = 1,2,
( , X ipk ) ) , i = 1,2,
, n1
, n2
1 nr
∑X
i =1
nr
(r ) ij
类似一元方差分析办法,将诸平方和变成了离差阵即:
第二个总体: Xi
(2)
= ( X i(2) , X i(2) , 1 2
…… …… …… (k ) (k ) (k ) 第 k 个总体: Xi = ( X i1 , X i 2 , 全部样品的总均值向量:
A = ∑ nr ( X( r ) ? X)′( X( r ) ? X)
r =1
k
, nk
E = ∑∑ ( X((ir)) ? X( r ) )′( X((ir)) ? X( r ) ) T = ∑∑ ( X((ir)) ? X)′( X((ir)) ? X)
r =1 i =1 r =1 i =1 k nr
nr
X1× p =
1 k nr ( r ) ∑∑ X(i ) = (X1 , X2 , n r =1 i =1
,Xp)
37
目录 上页 下页 返回 结束
38
目录 上页 下页 返回 结束
四、 多总体均值的检验
这里,我们称 A 为组间离差阵; E 为组内离差阵; T 为总离差阵。 很显然有 T = A + E 。 我们的问题是检验假设
四、 多总体均值的检验
巴 特 莱 特 ( Bartlett ) 提 出 了 用 χ Λ ~ Λ ( p, n, m) ,令 则 V 近 似 服 从 χ ( pm)
2
2
分布来近似。设
H 0:μ1 = μ 2 =
= μk
H1:至少存在i ≠ j使μi ≠ μ j
V = ?(n + m ? ( p + m + 1) 2) ln Λ = ln Λ1/ t
分 布 。 其 中 ,
用似然比原则构成的检验统计量为
E E Λ= = ~ Λ ( p, n ? k , k ? 1) T A+E
给定检验水平 α ,查 Wilks 分布表,确定临界值,然后作出统计判 断。在这里我们特别要注意,Wilks 分布表可用 χ 分布或 F 分布 来近似。
2
t = n + m ? ( p + m + 1) 2 。
39
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
40
四、 多总体均值的检验
Rao 后来又研究用 F 分布来近似。设 Λ ~ Λ( p, n, m) ,令
§3.3
协方差阵的检验
R=
1 ? Λ1/ L tL ? 2λ ? pm Λ1/ L
则 R 近似服从 F ( pm, tL ? 2λ ) ,这里 tL ? 2λ 不一定为整 数,可用与它最近的整数来作为 F 的自由度,且 min( p, m) > 2 。其中,
一、 检验 Σ = Σ 0
二、
t = n + m ? ( p + m + 1) 2
? p2 m2 ? 4 ? L=? 2 ? 2 ? p + m ?5?
λ=
pm ? 2 4
41
目录 上页 下页 返回 结束
检验 Σ1 =
= Σr
1/ 2
42
目录 上页 下页 返回 结束
一、 检验 Σ = Σ 0
设 X ( a ) = ( X a1 , X a 2 ,
一、 检验 Σ = Σ 0
, n) 来 自 p 维 正 态 总 体
然后,我们考虑检验假设
, X ap )′ (a = 1,2,
N p (μ, Σ) 的样本, Σ 未知,且 Σ > 0 。
首先,我们考虑检验假设
H 0:Σ = Σ 0 ≠ I p
令 则
H1:Σ ≠ Σ 0 ≠ I p
因为 Σ 0 > 0 ,所以存在 D ( D ≠ 0 ),使得 DΣ 0 D′ = I p 。
H 0:Σ = I p
所构造的检验统计量为
H1:Σ ≠ I p
Y( a ) = DX ( a )
a = 1,2,
*
,n
Y( a ) ~ N p ( Dμ, DΣD′) = N p (μ* , Σ* )
λ = exp ?? trS ? S
n
? 1 ? 2
? ?
n/2
?e? ? ? ?n?
np / 2
因此,检验 Σ = Σ 0 等价于检验 Σ = I p 此时构造检验统计量为
其中
S = ∑ ( X ( a ) ? X)( X ( a ) ? X)′
a=1
λ = exp ?? trS* ? S*
? 1 ? 2
? ?
n/2
?e? ? ? ?n?
np / 2
43
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
44
一、 检验 Σ = Σ 0
S* = ∑ (Y( a ) ? Y)(Y( a ) ? Y)′
a=1 n
二、
检验 Σ1 =
= Σr
其中
以通常采用 λ 的近似分布。
给定检验水平 α ,因为直接由 λ 分布计算临界值 λ0 很困难,所 在 H 0 成 立 时 , ?2 ln λ 极 限 分 布 是 χ
2 p ( p +1) / 2
分布。因此当
2
n >> p ,由样本值计算出 λ 值,若 ?2 ln λ > χα 即 λ < e="" ?="" χα="" 2="">
2
则拒绝 H 0 ,否则接受 H 0 。
上面讨论的检验 Σ = Σ 0 ,是帮助我们分析当前 的波动幅度与过去的波动情形有无显著差异。但在 实际问题中,我们往往面临多个总体,需要了解这 多个总体之间的波动幅度有无明显的差异。例如在 研究职工工资构成时,若按工业行业分组,就有采 掘业、制造业、文化教育、金融保险等,不同行业 间工资总额的构成存在波动,研究波动是否存在显 著的差异,就是做行业间协方差阵相等性的检验。
45
目录 上页 下页 返回 结束 目录 上页 下页 返回 结束
46
二、
检验 Σ1 =
= Σr
, N p (μ k , Σ k ) ,
二、
构造检验统计量为
k
检验 Σ1 =
ni / 2
= Σr
设有 k 个正态总体分别为 N p (μ1 , Σ1 ) ,
Σi > 0 且未知, i = 1,
(i ( X ((ia)) = ( X a1) , X ai2) ,
, k 。从 k 个总体分别取 ni 个样本
(i , X ap) )′
λk = n np / 2 ∏ Si
i =1
S
n/2
∏n
i =1
k
pni / 2
i
i = 1,
, k ;a = 1,
, ni
其中
这里
∑n
i =1
k
i
= n 为总样本容量。 = Σk
H1:Σi } 不全相等 {
S = ∑ Si
i=1
k
我们考虑检验假设
H 0:Σ1 = Σ 2 =
i i Si = ∑ ( X ((a)) ? X( i ) )( X ((a)) ? X( i ) )′
ni
α =1
X =
(i )
47
目录 上页 下页 返回 结束
1 ni
∑X α
=1
ni
(i ) (a)
48
目录 上页 下页 返回 结束
二、
检验 Σ1 =
= Σr
巴特莱特 Bartlett) ( 建议 , ni 改为 ni ? 1 , 将 从而 n 变为 n ? k ,
′ 称为修正的统计量,则 ?2 ln λk′ 近似分布 变换以后的 λk 记为 λ k ,
χ 2 (1 ? D) 。 其中 f
f = 1 p ( p + 1)(k ? 1) 2
? 2 p2 + 3 p ?1 ? k 1 1 ? ? ? ?∑ ?, ? 6( p + 1)(k ? 1) ? i =1 ni ? 1 n ? k ? D=? 2 ? (2 p + 3 p ? 1)( k + 1) n1 = n2 = ? 6( p + 1)(n ? k ) , ?
目录 上页
ni ≠ n j = nk
49
下页 返回 结束
50
矩阵正态分布参数的完全极大似然估计
矩阵正态分布参数的完全极大似然估计 第30卷第3期
2(】?年5月
东南大学(自然科学版)
3OURNAL0SOIYrBE.hSTk'N[VERSITYfNatnmlSden~EdiSon}
Vo1.30No.3
Mav2O00
矩阵iE态分布参数的完全极大似然估计
赵胜利朱道元
(东南太学应用数学系,南京210096)
摘要得到了矩阵正态分布的均值和方差的完全极大似然估计,它们都是无偏估 计,并且证明了它们是相互独立的
关键词堕堕垩查坌查;完空导
分类号O212.1卜
然函数;完空极大似然估计
设随机向量X,,(;0),0=(一,)'?O,一,是来自母体X的一个样本.其 中,O是空间中的区域.记it,…,与",是l,2,…,P的子序列,1?<P,它们满足 {il,…,ju{^,…,}={1,2,…,P},{i1,?一,In{I,…,3'r}=?,则称0I(…,,).= {(,…,).l(一,)C-@)为@在(…,).处的截面,这里(一,).是0…,
,,
…
,依下标按照从小到大的顺序排列而成的向量.
定义若记目=(Oi,…,),=(,…,),,(口)=,(口,)为似然函数,则
称MI(0I*)=I,(,)d为关于的完全导出似然函数.若1(9)=supM1(), 8I
则称0是的完全极大似然估计(TotallyMaximumLikelihoodEstimate),记为TMLE. 定义设Y=(y)是一个m×q的随机矩阵,其元素相互独立同服从N(o,1)分布.:
n×P,A:p×g和B:×m为常数矩阵.则Y=M+BYA服从矩阵正态分布,记为X,
(M,(BB)0(AA)).
引理1设",为来自母体X,(,,n0)的样本,i=?置,A: ?(Xi—)(置一X),则有
1)i与A独立,i,M,.),A葛Pf,式中,…,一1独立同分布于 (0,厶0V);
2)P(A>0);1的充要条件是n(一1)+1P.
证明1)记X=(X",),1=(1,…,lJ=(,…,厶),因为X,——一——一 ^'(M,厶0),所以X一‰p(10,(,m0厶)0)=^'帆(,0)显
收稿日期:1999—11—23.第一作者:男,1974年生,硕士研究生
124东南大学(自然科学版)第30卷
然,的n行之问相互正交,利用,作m,阶正交矩阵jn,r=(一.-1I),其中,厂爪: 士,.
?,
令Y=FX,则Y一‰p(,0)=(,0);其中,M=(0,…,
0,).对y分块,即Y=(一,);其中,为n×P的矩阵,i:1,…,m.于是有 一
p(0,厶0),i=1,…,m—l,一(,0),并且Y",相互独立.所
以i:莓置=jX=,‰(,厶.1),A=蓦(置一(置一)=
(一j)x=.r(一ml_jj)~Fx:rr一-lmYFJ,Jr,y:ry—
?r,且i与A独立.
2)令Y=(yt1,…,r一】),则Y一_~(一1)P(O,I(~- 00).记=(1,…,)
则Yij一(0,),且Yij相互独立,i=1,…,m一1,=1n.又因为A:?r ??,所以P(A>o):1的充要条件是n(一1)+l>P[11.…1I 推论l设X1,…,为来自母体,(,W0)的样本,==1?置,A: (置一i)(墨一),则有?与A独立,一M,.),A~一ZiZ*i,式中 z",z一1独立同分布于(O,0');?P(A>0):l的充要条件是p(m一1)+1
>n.
引理2若A与曰均为阶对称矩阵,且A?B,则有trA?trB,且等号成立的充要条件 是A=曰.
证明记A=(),B=().因为A?B,所以对任意非零向量,总有(^一? 0.特别的,对于第i个分量为1的单位向量,有e(A一e?0,即一b?0,所以.? 6i=1,…,n,由此即得trA?trB.若A=B,显然有trA=t.若trA=trB,因为A—B? 0,一阶主子式一bii?O,则有?=b=l,…,.如果A?B,则必存在,(k<)使 得all?钆.如记C=()=A—B,则C?0,c=0,c?=0,c:C/~?0,从而的二阶 主子式iol:一c<0,这与C?0矛盾,故而A:曰.1C/kl 定理矩阵正态分布参数的TMLE.
设一,为来自母体一_?n(村,厶0V)的样本,(m一1)+1>P,且没有关于 参数的先验信息,则1)M的TMLE为府=;2)V的TMLE为:—A. ,n一1n
证明1)L(M,):(h)一IVj-Ttrf一1妻(Xi一)V-1(置一)l:(2)一 I一B),其中曰=蓦(置一(Xi一易证:A一(i一)
一
e
略
第3期赵胜利等:矩阵正态分布参数的完全极大似然估计125 ?A,取庸=X,贝q有
M1():(2)一
M1(廊):(2?)一
』…一m{_
』…一etr(-
.
(庸)一MI(M):(2)一』ll一(etr{一1一1d)一etr{一i1—lB})aV 由B?A,V一'>0,可得tr(V-1?【I(一A),故上式被积函数恒非负,所以总有Ml(庸)
一
M1()?0,即M1(庸)?M1(),等号成立等价于被积函数恒等于零,即tr(V-lB)= tr(一A),或tr(B):tr(A),由引理2知tr(:tr(A)成立的充要条件是A=B,或M=i, 从而M的TMLE为庸:i.
2)由1)可得工(,):(2兀)一lVI一etI{一1一1d)etI{一l=v-'(一)(i一)), 若记E=,则有
():(h)一II一e"{一{Aetr{一lmv一(i一)(—M)}dM=
(2)一II一etr{一{_1A)fetr{一{(一i)(m)(—i)dM=
(2)一lI一etr{一{一1A}(2)Im—II一{:
(2)一一ll一.?f一{一1d1
其中,第2个等式中的积分』e【I{一{(一i)(m一)(一i)dM中的被积函数的形式与 矩阵正态分布的密度函数的形式相同,由矩阵正态分布的密度函数积分为1,可得 』e【I{一{(村一)(玑一)(一)dM=(2)lmI一{.因为n(玑一1)+l>p时,由 引理1可得P(A>O):1.所以存在可逆矩阵c,使A=CC,令=C一'(C)_.,则,lVl= l,:c'c,e【r{_IV)=e【T{_{一),所以()=(2)一m一
l!一}Al一.trf一3-v一一1:(2)一一竽l"(^一,其
中,^1?^2?…?>0是一的特征根.易证()当且仅当^I=…=^P=(m—I)n 时达到最大,此时矿:l一,p,所以=,c=CC.=向,即=
A为的TMLE.
推论2设X一,为来自母体X,(M,0)的样本,P(m一1)+1>,且 没有关于参数的先验信息,则1)M的TMLE为庸=X;2)的TMLE~./帝=A 证明1)L(M,)=(h)一ll一etr{一{喜(置一)'(五一))=
dd
1??1?J
8A
一一
l一2l一2
126东南大学(自然科学版)第?卷
(2)一II一etrf一{一1B?1,其中B*:(置一M)(Xi一肘).易证B:A+(i
—
M)(X—).,B?A,下面的证明与定理中1)相似,可得M的完全极大似然估计为廊= .
2)L(M,)=(2)一IWI一etr{一{一A)etr{一{一(一)(i—).),下
面的证明与定理的2)相似,可得=(,为的完全极大似然估计
当P=1时,推论2变为一(,),即为通常的多元正态分布,的完全极大似然估 计为卢=i,的完全极大似然估计为主=(%一)(—).
推论3设",为来自母体一(M,W0V)的样本,m>np,且没有关于参 数的先验信息,则M的TMLE为廊=,U=W0V的TMLE为
=一i(v(一.))(vec(一i))
推论4设x一,为来自母体X一?(M,0)的样本,n(m—1)+l>P,若 W>0已知,且没有关于未知参数M与V的先验信息,则M的TMLE为廊=i,V的TMLE为
(置一)(置一i).
推论5设1,…,为来自母体,_?n(,W0V)的样本,P(m一1)+1>n,若 >0已知,且没有关于未知参数M与W的先验信息,则M的TMLE为廊:,W的TMLE
为(置)V-1-)J.
参考文献
1方开泰.实用多元统计分析.上海:华东师范大学出版社,1986.83—87 2赵胜利,朱道元.冯玉英.完全极大似然估计东南大学,20OO,30(1):136—140 TotallyMaximumLikelihoodEstimationsoftheParameters
0fMatrixNormalDistribution
Zhaoshe,eliZhuDaoyuan
(D...mj0f^edMathematics,‰出咖Univer~ty,N如jing21C(Y36) Abstract:Thetotallymaximumlikelihoodestimationsofn-皿valueandvarianceofMatrixnormaldis—
trlbutionalegotandtheirindependencealeprovedinthisarticle.
Keyw
出:matrixnormaldistribution;totallyderivativelikelihoodfunction;totallym~imumlikeli
—
hoodestimation
第二章 多元正态分布的参数估计
第二章 多元正态分布的参数估计
第二节 基本概念
一、随机向量
1. 用向量X = (X1 , X2 , … , XP )' 表示对同一个体观测的p 个变量 2. 将所研究对象的全体称为总体,它是由许多(有限和无限)的个体构成的集合
注(1)如果构成总体的个体是具有p 个需要观测指标的个体,我们称这样的总体为p 维总体(或p 元总体)
(2)这里“维”(或“元”)的概念,表示共有几个分量
3. 若观测了n 个个体,则可得到如表2.1的数据,称每一个个体的p 个变量为一个样品,而全体n 个样品组成一个样本
1 2
表2.1 数据
X 11 X 12 X 22
X 1p X 2p
X 21
n
X n 1 X n 2
X np
横看表2.1,记为
X (α) =(X α1, X α2, , X αp ) ' , α=1,2, , n
表示第α个样品的观测值
竖看表2.1,第j 列的元素
X j =(X 1j , X 2j , , X nj ) ' , j =1,2, , p
表示对第j 个变量X j 的n 次观测数值
因此,表2.1所反映出的样本资料可用矩阵表示为
?X 11?X 21
X =?
? ???X n 1
X 12 X 22 X n 2
'?X 1p ??X (1)
?X '? X 2p ??=(X , X ,?(2)? (2.1) ,X ) =12p
? ? ?
???
' X np ?X ???(n ) ??
简记为X
4. 将p 个随机变量X 1, X 2, , X p 的整体称为p 维随机向量,记为X =(X 1, X 2, , X p ) '
注在对随机向量的研究仍然限于讨论离散型和连续型两类随机向量。
二、多元分布
1. 定义2.2 设X =(X 1, X 2, , X p ) '是p 维随机向量,它的多元分布函数定义为
F (x ) ?F (X 1, X 2, , X p ) =P (X 1≤x 1, X 2≤x 2, , X p ≤x p ) (2.2)
记为X ~F (x ) ,其中x =(x 1, x 2, , x p ) '∈R p ,R p 表示p 维欧氏空间 注多维随机向量的统计特性可用它的分布函数来完整地描述 2. 定义2.3 设X =(X 1, X 2, , X p ) '是p 维随机向量,若存在有限个或可列个p 维数向量x 1, x 2, ,记P (X =x k ) =p k ,(k =1,2, ) 且满足p 1+p 2+ =1,则称X 为离散型随机向量,称P (X =x k ) =p k ,(k =1,2, ) 为X 的概率分布
3. 设X ~F (x ) ?F (x 1, x 2, , x p ) ,若存在一个非负函数f (x 1, x 2, , x p ) ,使得对一切x =(x 1, x 2, , x p ) '∈R p 有
x 1
x p
F (x ) ?F (x 1, x 2, , x p ) =? ?f (t 1, t 2, , t p ) dt 1 dt p (2.3)
-∞
-∞
则称X 为连续型随机变量,称f (x 1, x 2, , x p ) 为分布密度函数,简称为密度函数或分布密度
4. 一个p 元函数f (x 1, x 2, , x p ) 能作为R p 中某个随机向量的密度函数的主要条件是:
(1)f (x 1, x 2, , x p ) ≥0,?(x 1, x 2, , x p ) '∈R p ; (2)? ?f (x 1, x 2, , x p ) dx 1 dx p =1
-∞
-∞+∞
+∞
5. 离散型随机向量的统计性质可由它的概率分布完全确定,连续型随
机向量的统计性质可由它的分布密度完全确定
6. 定义2.4 设X =(X 1, X 2, , X p ) '是p 维随机向量,称由它的q (
1
2
q
分布,相对地把X 的分布称为联合分布。通过变换X 中各分量的次序,总可假定X (1)正好是X 的前q 个分量,其余p -q 个分量为X (2) ,则
?X ?
X =?(2) ?,
?X ?p -q
?x (1)?
相应的取值也可分为两部分x =?(2)?
?x ?
X (1)的分布函数即边缘分布函数7. 当X 的分布函数是F (x 1, x 2, , x q ) 时,
(1)q
为:
F (x 1, x 2, , x q ) =P (X 1≤x 1, , X q ≤x q )
=P (X 1≤x 1, , X q ≤x q , X q +1≤∞, , X p ≤∞) =F (x 1, x 2, , x q , ∞, , ∞)
8. 当X 有分布密度f (x 1, x 2, , x p ) 时(亦称联合分布密度函数),则X (1)也有分布密度,即边缘密度函数为:
+∞
+∞
f 1(x 1, x 2, , x q ) =? ?f (x 1, , x p ) dx q +1, , dx p
-∞
-∞
9.定义2.5 若p 个随机变量X 1, X 2, , X p 的联合分布等于各自的边缘分布的乘积,则称X 1, X 2, , X p 是相互独立的
三、随机向量的数字特征
1. 定义2.6 设X =(X 1, X 2, , X p ) ',若E (X i ) (i=1, , p ) 存在且有限,则称E (X )=(E (X 1), E (X 2), , E (X p )) '为X 的均值(向量)或数学期望,有时也把E (X ) 和E (X i ) 分别记为μ和μi ,即μ=(μ1, μ2, , μp ) ',容易推得均值(向量)具有以下性质:
(1)E (AX ) =A E (X ) (2)E (AXB ) =A E (X ) B
(3)E (AX +BY ) =A E (X ) +B E (Y )
其中,X 、Y 为随机向量,A 、B 为大小适合运算的常数矩阵 2. 定义2.6 设X =(X 1, X 2, , X p ) ',若E (X i ) (i =1, , p ) 存在且有限,则称E (X ) =(E (X 1), E (X 2), , E (X p )) '为X 的均值(向量)或数学期望,有时也把E (X ) 和E (X i ) 分别记为μ和μi ,即μ=(μ1, μ2, , μp ) ',容易推得均值(向量)具有以下性质:
(1)E (AX ) =A E (X ) (2)E (AXB ) =A E (X ) B
(3)E (AX +BY ) =A E (X ) +B E (Y )
其中,X 、Y 为随机向量,A 、B 为大小适合运算的常数矩阵。 3. 定义2.7 设X =(X 1, X 2, , X p ) ',Y =(Y 1, Y 2, , Y p ) ',称D (X ?) E X (-E X () X ) -(E ' X () )
?Cov (X 1, X 1) Cov (X 1, X 2) Cov (X 1, X p ) ??Cov (X , X ) Cov (X , X ) Cov (X , X ) ?
21222p ?
=?(2.4) ?? ??Cov (X , X ) Cov (X , X ) Cov (X , X ) ??p 1p 2p p ??
为X 的方差或协差阵,有时把D (X ) 简记为Σ,Cov (X i , X j ) 简记为σij ,从而有Σ=(σij ) p ?p ;称随机向量X 和Y 的协差阵为 Cov (X , Y ) ?E (X -E (X ))(Y -E (Y )) '
?Cov (X 1, Y 1) Cov (X 1, Y 2) Cov (X 1, Y p ) ??Cov (X , Y ) Cov (X , Y ) Cov (X , Y ) ?
21222p ?
=?(2.5) ?? ??Cov (X , Y ) Cov (X , Y ) Cov (X , Y ) ??p 1p 2p p ??注(1)当X =Y 时,即为D (X )
(2)若Cov (X , Y ) =0,则称X 和Y 不相关,由X 和Y 相互独立易推得Cov (X , Y ) =0,即X 和Y 不相关;但反过来,当X 和Y 不相关时,一般不能推知它们独立
4. 当A 、B 为常数矩阵时,由定义可以推出协方差阵有如下性质: (1)对于常数向量a ,有D (X +a ) =D (X ) (2)D (AX ) =A D (X ) A '=A ΣA ' (3)Cov (AX , BY ) =A Cov (X , Y ) B ' (4)设X 为n 维随机向量,期望和协方差存在,记μ=E (X ) ,Σ=D (X ) ,A 为n ?n 常数阵,则 E (X 'AX ) =tr (A Σ) +μ'A μ
注对于任何的随机向量X =(X 1, X 2, , X p ) '来说,其协差阵Σ都是对称阵,同时总是非负定(半正定)的。大多数情况是正定的
5. 若X =(X 1, X 2, , X p ) '的协差阵存在,且每个分量的方差大于零,则称随机向量X 的相关阵为R =Corr (X ) =(ρij ) p ?p ,其中
ρij =
Cov (X , X ) =
σi , j =1, , p (2.6)
为X i 与X j 的相关系数。
注在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来
的影响,往往在使用各种统计分析之前,常需要将每个指标“标准化”,
即进行如下变换X *j =
X -E (X ) , j =1, , p (2.7)
对数正态分布参数的最大似然估计
2007年第6期九江学院学报 No, 6, 2007 Journal of jiujiang University (总第143期)
(Su m N0143)
对数正态分布参数的最大似然估计
于 洋 孙月静
(东北财经大学数学与数量经济学院 辽宁大连 116025)
摘要:利用最大似然估计法求出了对数正态分布两个参数的估计量, 并讨论了它们的
无偏性和相合性。 关键词:对数正态分布; 最大似然估计; 无偏估计量; 相合估计量 中图分类号:O 212 文献标识码:A 文章编号:1673-4580(2007) 06-0055-(03)
1 对数正态分布
对数正态分布在经济学和金融学中有着重要
的应用。例如在金融市场的理论研究中, 著名的B lack -Scholes 期权定价公式, 程、广泛的应用。:
定义1 X 的函数1n X 服从正态
222
分布N (μ, σ) , σ>0, 则称X 服从参数为μ和σ的对数正态分布(logno r m al distribution ) , 记作X
2
~LN (μ, σ) 。
对数正态分布的密度函数为:
2
-e 2σ2, x >0
f (x ) =πσx 2
πσ=(2
2
2
Πi =1
n
-
2
i =1
2
(ln x i -μ) ,
n
x >=2, ) ,
2
πσ2) -ln L (μ, σ) =-ln (22
ln Πx i -i =1
n
σ2
2
i =1
2
ρ(ln x i -μ)
n
似然方程组为
2
n
=2ρ(ln x i -μ) =0
μ9σi =1
2
) n 2
) =0=-22+4ρ(ln x i -μσσσi =1922
解得
(1)
μ^=
0, x ≤0
文献[1]给出了服从对数正态分布的随机变量X 存在k (k 为正整数) 阶原点矩, 并且
EX
k
n i =1
ρln x i , σ^=
2
n
2
n i =1
ρ(ln x i -
n
n i =1
ρln x i ) ,
n
2
故μ与σ的最大似然估计量分别是n
μ^=ρln X i
n i =1
(4) (5)
=e
μk
2
当k 分别等于1和2时, 有
EX =e EX
2
n n 22σ^=ρ(ln X i -ρln X i )
n i =1
n i =1
(2)
μ2
2
=e
μ+2σ22
2
2
由(2) 式、(3) 式以及最大似然估计的不变[2]
性, 对数正态总体X 的均值EX 、方差DX 以及σ的最大似然估计量分别为
EX =e
μ^2
从而DX =EX -(EX ) =e -e =
22μ+σσ2
(e -1) (3) e
2
2 参数μ和σ的最大似然估计
2
设总体X 服从参数为μ和σ的对数正态分布, X 1, X 2, …, X n 为来自总体X 的简单随机样本。根据最大似然估计法的原理, 由(1) 式,
(ln x -μ) 2n
2-似然函数为L (μ, σ) =Πe 2σ2
i =1
πσx i 2
收稿日期:2007-03-01
μ+2σ22μ+σ22
2
, DX =e
n
μσ2^+^2
(e
n
σ^2
-1) ,
2
σ^=
n i =1
ρ(ln X i -
n i =1
ρln X i ) 。
在实际应用时, 给定一组样本值, 代入计算便
σ2及其函数EX 、可求出参数μ、DX 和σ的最大似然估计值。
例如样本值为0125, 018, 1, 2, 215, 计算可得
作者简介:于洋(1979- ) , 男, 东北财经大学数学与数量经济学院教师, 理学硕士。
?56?μ^=
九江学院学报 2007年第6期
n
n i =1
ρln x i =
×ln1=0, 5
(6)
22
根据定理1有ES Y =σ, 从而
22
σ2) n n 22
σ^=ρ(ln x i -ρln x i ) =×312916=
n i =1n i =15
01,
EX =e
02×016583
E ^=E
n
S Y =
n
2
≠σ
=113898,
2
016583
故σ^是σ的有偏估计量。但是
22
σ=σ2li m E ^=li m
n ?∞
n ?∞
22
n
(7)
DX =(113898) (e -1) =117992,
σ^=018114。
3 无偏性和相合性
2
前文给出了对数正态分布的两个参数μ与σ的最大似然估计量, 接下来本文将讨论所得估计量(见(4) 式和(5) 式) 的优良性。这里只讨论它们的无偏性和相合性。
定义2 设 ^= ^(X 1, …, X n ) 为未知参数 的估计量, 若E ^= , 则称 ^为 的无偏估计量, 否则称 ^为 的有偏估计量。若li m E ^= , n ?∞
因此σ^是σ的一个渐进无偏估计量。
2
虽然σ的最大似然估计量是有偏的, 但改进后的估计量
n n 22
^=ρ(ln X i -ρln X i ) n -1n -1i =1n i =1
2
却是σ定义 设 ^= ^(, n ) 为未知参数 , ^ε>0, 有li ^是 的相合估^1, 则称
?22
^为 的渐进无偏估计量。
2定理1 设总体X N , >, X 1, X 2, …X n X ,
222
S =ρ1X ) 为样本方差, 则ES =
n -1i =1
σ2, DS 2=4。
n -1
[2]
有关定理1的证明见文献。
2
命题1 设总体X 服从参数为μ和σ的对数正态分布, X 1, X 2, …, X n 为来自总体X 的简单随机
n n 2
样本, μ^=ρln X i 与σ^=ρ(ln X i -n i =1
n i =1
。
。一个相合估计量意味着, 只要样本容量n 足够大, 就可以保证估计误差达到任意给定的精度。如果一个估计量不是相合估计, 则它就不是一个好的估计量, 在应用中往往不考虑。下面的定理可以检验一个估计量是否为相合估计量:
定理2 设 ^= ^(X 1, …, X n ) 为参数 的一个估计量, 若
li m E ^= 且li m D ^=0,
n ?∞
n ?∞
n i =1
ρln X i ) 分别为μ与σ的最大似然估计量, 则μ^
2
2
n
22
是μ的无偏估计量, σ^是σ的渐进无偏估计量。
证明:令Y =ln X, Y i =ln X i (i =1, …, n ) , 则n n
=ρY i =ρln X i , Y
n i =1
n i =1
则 ^是 的相合估计量。
定理的证明见文献[3]。
2
命题2 设总体X 服从参数为μ和σ的对数正态分布, X 1, X 2, …, X n 为来自总体X 的简单随机
n n 2
样本, μ^=ρln X i 与σ^=ρ(ln X i -n i =1
n i =1
n i =1
ρln X i ) 分别为μ与σ的最大似然估计量, 则μ^
2
2
n
22
由题设及定义1, Y =ln X ~N (μ, σ) , 于是
2
EY =E (1nX ) =μ, D Y =D (1nX ) =σ,
n n
μ从而E ^=E (ρln X i ) =ρE (ln X i ) =
n i =1
n i =1
E (ln X ) =μ, 即μ^是μ的无偏估计量。
2
另一方面, Y 的样本方差为n n 22
S Y =ρ(Y i - Y ) =ρ(ln X i -n -1i =1n -1i =1n i =1
与σ^分别是μ与σ的相合估计量。
2
证明:由题设, ln X ~N (μ, σ) , E (ln X ) =μ, 而ln X 1, ln X 2, …ln X n 可看作来自总体ln X 的简单随机样本, 于是E (ln X i ) =E (ln X ) =μ, i =1, …, n, 由辛钦大数定律, 对任意ε>0,
n
有li m P =ρln X i -
n i =1
n ?∞
li m P{μ^-<>
ρln X i )
n
2
n n 222
σ(于是^=ρln X i -ρln X i ) =S Y
n i =1
n i =1
n
根据定义3可知μ^是μ的相合估计量。
由(6) 式和定理1有
222
σ2() ()
D ^
=D
n S Y
=
n
DS Y
=2
于 洋, 等:对数正态分布参数的最大似然估计
?57?
4
2?0(n ?∞) n
22
结合(7) 式和定理2可知σ^是σ的相合估计
量。
参考文献:
[1]叶林, 邓筱红. 对数正态型随机变量特征函数的性质[J ].九江师专学报(自然科学版) ,
2002(5) :12.
[2]龙永红主编. 概率论与数理统计(第二版) [M].北京:高等教育出版社, 2004. 146.
[3]滕素珍, 冯敬海编著. 数理统计学(第四版) [M].大连:大连理工大学出版社, 2005. 77.
THE MAX I M UN L IKE L I HOOD ESTI M A TI ON O F LOGNORMAL D I STR I BU TI ON P ARAM YU Yang; SUN -J (School of M athe m atics and Quantitative Econo m ics, D ongbei U ics, D alian, 116025) AB STRA C T This paper derives ors o on para meters by using of maxi m u m likeli 2
hood method and then esti at consistency esti m at or .
KEY W O maxi m u m likelihood esti m ati on; unbiased esti m at or; consistency esti 2
mat or
(责任编辑 陈平生)
(上接第39页)
[19]Schaffer G . B. , McCor m ick P .
[J ].Metall .
G . Anomal ous combusti on effects during mechanical all oying
Trans . A, 1991, 22A (12) :3019.
[20]Mulas G . , Loiselle S . , Schiffini L. , and Cocco G . The mechanoche m ical self -p r opagating reac 2
ti on bet w een hexachl or obenzene and calciu m hydride [J ].J. Solid State Che m. , 1997, 129:263.
[21]Dopp iu S . , Monagheddu M. , and Cocco G . . Mechanoche m istry of the titaniu m -silicon syste m:
compositi onal effects [J ].J. Mater . Res . , 2001(5) :1266.
RESEARCH PROGRESS O F THE REACTI ON M ECHAN ISM O F
SOL I D -STA TE COMBUSTI ON I NDUCED B Y M ECHAN ICAL ALLO YI NG
M A M ing -liang; SON G Sh i -hua
(Facu lty of m echanical eng ineering, J iu jiang U n iversity, J iujiang, J iangxi, 332005, China ) AB STRA C T The theory and characteristics of mechanical all oying have been briefly intr oduced . The reacti on
mechanis m of s olid -state combusti on induced by mechanical all oying has been e mphatically discussed, and the further devel op ing directi on has been put f or ward .
KEY W O RD S mechanical all oying; s olid -state combusti on reacti on; mechanis m
(责任编辑 陈平生)
非对称损失函数正态分布总体的参数设计
非对称损失函数正态分布总体的参数设计
非对称损失函数正态分布总体的参数设计
0引育
胡家喜,李春萍,郝会兵
(孝感学院数学系,湖北孝感432100)
摘要:文章在损失为非对称的情况下,讨论了参数设计的可行性,证明了田口方法
的稳健设计
和灵敏度设计依然有效,给出了参数设计的方法与具体步骤. 关键词:参数设计;非对称的损失函数;质量损失;调整参数 中图分类号:O212.6文献标识码:A文章编号:1002—6487(2008)12-O150—02
在制造和生产中.工序过程受到许多随机因素和系统因 素的影响,使加工出来的产品质量偏离目标,从而造成损失. 事实上,在生产过程中我们常假定控制特征的概率分布及损 失函数是对称的,并把规格中心当作最优目标值.然而在实 际中.许多偏离目标的损失并不是对称的,如对一轴零件的 加工超过上限,可以返工,而小于最小容差尺寸就要作废,损 失显然是非对称的,在这种情况下,使工序加工出的产品均 值等于目标值,并不会使期望损失最小.因此在损失为非对 称的情况下,如何优化过程均值,使其接近目标值m,尤为 重要.文献【2卜[4]主要讨论了在非对称的二次损失函数下,总 体参数的设计问题.本文在此基础上考虑了另一种非对称的 损失函数,补充了他们的结论.
设随机变量X为考察的某一望目特性的数量性能指标. 其数学期望为,方差为盯.0<m<?是此性能指标x的目标 值.当然,最理想的情形是,所有产品的性能指标值均取值为 m,但是事实上这是很难做到的,往往产品的指标值与m之 间有一个距离,这样就造成了损失.田口先生定义了如下的
质量损失函数:
L()()=k()(-m)(1)
田口先生称此产品的平均质量(数学期望)为质量水平, 即
E[L(X)I=k[E(X一)2+(一m)2】=k(cr+82)(2) 质量损失函数(1)量化了产品性能波动所造成的损失, 此外还进一步提供了减小波动所造成损失的一个方法.由分 解式(2)可以看到,产品的平均质量损失被分解成了两个部 分:一部分是仃,它是由产品的质量波动造成的,实际上就是 性能指标X的方差.另一部分是6,是由性能指标的数学期 望与目标值的偏差造成的.
田口先生据此提出这样的参数设计的途径:(1)先进行 稳健性设计与分析,变动构成产品的各个部件的参数,使产 基金项目:孝感学院科研基金资助项目
150统计与决镱2008年第12期(总第264期) 品的质量尽量稳定,减小性能指标的方差,即减少性能波动 损失仃.(2)再进行灵敏度设计,缩短性能指标的期望与目标 值之间的距离,利用对方差影响不大的参数,在保持方差不 增大的前提下,将x的数学期望为调整至m,使得偏差8: 0,以减少损失.
1非对称的损失函数
考虑非对称的损失函数:
fk,fX—m,X?m
L(x):{:,:(3),【k
2fX—m1X>m,
其中kl,k2>0
如果x的分布密度为f(x;O),其中e=(e一,en)为参数向 量,则产品的平均质量损失为:
L(e):E【L(x):J一L(x)f(x;0)dx :
』:k.(x—m)2f(x;0)dx+I::kx—m)t(x;O)dx](4) 可以看出.此时平均质量损失还与产品本身所服从的分 布有关.本文仅就最常用的正态性能指标,在质量损失函数 非对称的情况下,讨论参数设计的可行性,定义了调整参数, 求出了最优调整参数值,使质量损失达到最小,从而提高产 品质量.
2非对称质量损失函数下正态总体参数设
计的构造
设性能指标X服从正态分布,冥密度函数为
fix;Ix,o"2):—一exp[一](5)
V2-my2盯
其中盯>0.数学期望E(X)=lX;方差D(x):仃.由(4)式,可得 L(,cr2)=E[L(X)]
=
k1(x-m)exp卜]dx+k2(一)
._l__exp[一_1(】x=m一)+k2],.exp[一二l+ X/2wit2【『,/2盯'2【『
[k-【『+k-(一m)一kz(一m)]4)()+kz(一m)
对(6)式分别求关于,【『的偏导数,有
:2kliT4)(rn二)+k
旦=[2k
0
(_m))一
U【丁
2k—一exp[一二1+k.(8)
V2盯2盯
其中4)(x)为标准正态分布的分布函数,做变换=(m一), 【『,并称为调整参数,同时r=k.iT/k令为非对称比率,则有
L(,【丁=k【丁g()(9)
—
:
5=k2iTg'(h)=kzh()(10) 其中g()=(r+1)_exp『_萼一],/2盯
+(I'+r.一)4)()+(11)
h()=(2rh一1)qb(h)一:exp[一擎]+1(12),/2盯 由(7)式可知,平均质量损失L(,its)关于标准差【『严格单调 增加.由于iT>0,要减少平均质量损失L(,【『2),性能指标的方 差越小越好.这表明参数设计的第一部分稳健性设计与分析 还是必须且有效的
下面讨论灵敏度设计.当偏差8=0,即=m时,有 ,一去?.
此时平均质量损失L(,【『2)没有达到最小值.显然满足 :
0的点使L(,【丁:)达到最小值,由(10)式即可求解以 0U
下非线性方稃.
h():(2rh一1)qb(h)一exp[一擎]+1=0(13),/2盯z 由于方程(13)的解只与r有关.对于给定的质量损失函 数,r即给定,设是相应的方程(13)的解,称之为最优调整 参数.此时无论性能指标的方差【T取到多小,使得L(,iT2)最 小的总满,~m-p=X.
此时L(,【丁z)=k2【丁g(h).C【丁
做灵敏度设计时,只要将性能指标的数学期望调整到 in一【『(而不是in)即可.
对于方程(13),可运用牛顿迭代法解得,即对于给定的 r,代人方程(13),即可求解出相应的.
参数设计步骤如下:
(1)确定望目特性的性能指标的质量损失函数,计算损失 系数比r:
(2)对于以上r值,求解方程(13)得到相应的最优调整参 数:
(3)对性能指标做稳健性设计,使x的标准差尽量地小, 取值为【『;
(4)对性能指标做灵敏度设计,将数学期望调整到m一 【丁
参考文献:
[1J田口玄一.质量工程学概论[M].北京:中国对外翻译公司,1985. [2J程岩等.非对称损失下威布尔分布总体的参数设计?.中山大学 (自然科学版),2004,43(6).
[3J程岩等.基于非对称损失函数的参数设计【J1.应用概率统计, 2005,21(4).
[4]程岩等.基于非对称损失函数指数分布总体的参数设计[JJ.数学 的实践与认识.2006.36(6).
(责任编辑/李友平)
统计与决策2008年第12期(总第264期)151
转载请注明出处范文大全网 » ch3多元正态分布参数的检验