范文一:序列相关性的检验与修正
序列相关性的检验与修正
案例:书本P115进口与国内生产总值的关系。
一 检验
准备工作:建立工作文件,导入数据。采用OLS方法建立进口方程。 在命令框输入:
equation Eq01.ls m c gdp
建立残差序列
在命令框输入: series e=resid 建立残差序列的滞后一期序列
在命令框输入: series e_lag1=resid(-1)
方法1:利用两个残差序列画图、观察。
方法2:查看回归方程的DW值=0.628,存在序列相关。 方法3:LM检验
在命令框输入:
equation Eq02.ls e c gdp e(-1) e(-2)
可得LM1=15.006
在命令框输入:scalar chi1=@qchisq(0.95,2) 可得chi1=5.99
可以判定模型存在2阶序列相关。
简便方法:在方程eq01窗口中点击View/Residual Test/Series Correlation LM Test,并选择滞后期为2,则会得到如下图所示的信息。
注:LM计算结果与上面有差异,因为这里的辅助回归所采用的resid(-1)、resid(-2)的缺失值用0补齐。
检验是否存在更高阶的序列相关。继续在命令框输入:
equation Eq03.ls e c gdp e(-1) e(-2) e(-3)
可得LM2=14.58
在命令框输入:scalar chi2=@qchisq(0.95,3)
可得chi2=7.185
仍然存在序列相关性,但由于e(-3)的参数不显著,可认为不存在3阶序列相关。
在方程eq01窗口中点击View/Residual Test/Series Correlation LM Test,并选择滞后期为3,则会得到如下图所示的信息。
显然,LM检验的结果拒绝原假设(无序列相关),表明存在序列相关性。
二 序列相关性的修正与补救
广义差分法就是广义最小二乘法(GLS),但损失了部分样本观测值,损失的数量依赖于序列相关性的阶数(如一阶序列相关,至少损失1个样本值)。
在实际操作中,往往基于广义差分法完成估计。根据随机扰动项相关系数估计方法的不同,可以分为C-O迭代法和Durbin两步法。 (1)Durbin两步法
第一步,估计随机扰动项的相关系数
根据前面检验可知存在二阶序列相关,因此设定方程为
Mt??0??1Mt?1??2Mt?2??1GDPt??2GDPt?1??3GDPt?2??t
*
*
*
*
在命令框输入 ls m c m(-1) m(-2) gdp gdp(-1) gdp(-2)
即得到随机扰动项相关系数的估计值,结果记为eq04
第二步,进行差分变换,然后对应书本(4.2.20)公式进行回归。
Mt?Mt?(0.938Mt?1?0.469Mt?2)
*
GDPt?GDPt?(0.983GDPt?1?0.469GDPt?2)
*
在命令框中输入
Series m_star=m-(0.938*m(-1)-0.469*m(-2))
Series gdp_star=gdp-(0.938*gdp(-1)-0.469*gdp(-2))
将Mt对GDPt回归。在命令框输入
*
*
Ls m_star c gdp_star
结果记为
eq05
? (参考书本4.2.20式) 第三步,还原?0
???0
??0
*
垐1????2
1
?
78.161?0.938?0.469
?147.19
这一结果与eq01有差别。
(2)C-O迭代法
原理:参见教材113页。
操作:非常简单。
根据前面检验可知存在二阶序列相关,因此设定方程为
Mt??0??1GDPt??1AR(1)??2AR(2)??t
在命令框中输入
从DW值来看,已经不存在序列相关性,并且每项AR的回归系数都具有统计显著性。
假设采用1阶广义差分,在命令框中输入
Equation eq07.ls m c gdp ar(1)
从DW来看,序列相关性并未消除。
假设采用3阶广义差分,在命令框中输入
Equation eq08.ls m c gdp ar(1) ar(2) ar(3)
从DW来看,序列相关性已经消除。但AR(3)的回归系数不显著,表明过度差分。
范文二:时间序列相关性检验-自相关
序列相关性检验 (一)一元线性回归结果:
Dependent Variable: Y
Method: Least Squares
Date: 06/01/12 Time: 14:16
Sample: 1981 2007
Included observations: 27
Variable Coefficient Std. Error t-Statistic Prob.
C 4276.362 1079.786 3.960380 0.0005
X 0.871668 0.029448 29.60012 0.0000 R-squared 0.972258 Mean dependent var 24869.44 Adjusted R-squared 0.971149 S.D. dependent var 25261.92 S.E. of regression 4290.920 Akaike info criterion 19.63758 Sum squared resid 4.60E+08 Schwarz criterion 19.73356 Log likelihood -263.1073 F-statistic 876.1668 Durbin-Watson stat 0.174669 Prob(F-statistic) 0.000000
(二)拉格朗日乘数检验:
含二阶残差项的回归结果:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 120.8648 Probability 0.000000 Obs*R-squared 24.65421 Probability 0.000004
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 06/01/12 Time: 13:50
Variable Coefficient Std. Error t-Statistic Prob.
C 361.5102 372.6461 0.970117 0.3421
X -0.025697 0.013222 -1.943398 0.0643
RESID(-1) 1.477525 0.193620 7.631049 0.0000
RESID(-2) -0.485298 0.229297 -2.116459 0.0453 R-squared 0.913119 Mean dependent var -2.29E-12 Adjusted R-squared 0.901787 S.D. dependent var 4207.593 S.E. of regression 1318.618 Akaike info criterion 17.34251 Sum squared resid 39991346 Schwarz criterion 17.53449 Log likelihood -230.1239 F-statistic 80.57655 Durbin-Watson stat 1.772240 Prob(F-statistic) 0.000000
含三阶残差项的回归结果:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 77.16026 Probability 0.000000 Obs*R-squared 24.65663 Probability 0.000018
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 06/01/12 Time: 13:53
Variable Coefficient Std. Error t-Statistic Prob.
C 340.4064 405.7832 0.838887 0.4106
X -0.024688 0.015080 -1.637160 0.1158
RESID(-1) 1.464982 0.214682 6.823974 0.0000
RESID(-2) -0.441789 0.371964 -1.187721 0.2476
RESID(-3) -0.039199 0.260256 -0.150618 0.8816 R-squared 0.913208 Mean dependent var -2.29E-12 Adjusted R-squared 0.897428 S.D. dependent var 4207.593 S.E. of regression 1347.559 Akaike info criterion 17.41555 Sum squared resid 39950151 Schwarz criterion 17.65552 Log likelihood -230.1100 F-statistic 57.87019 Durbin-Watson stat 1.751706 Prob(F-statistic) 0.000000
序列相关性消除 (一)二阶迭代法回归结果:
Dependent Variable: Y
Method: Least Squares
Date: 06/01/12 Time: 15:22
Sample(adjusted): 1983 2007
Included observations: 25 after adjusting endpoints
Convergence not achieved after 100 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 921803.7 58583291 0.015735 0.9876
X 0.603615 0.087945 6.863519 0.0000
AR(1) 1.519561 0.189668 8.011678 0.0000
AR(2) -0.520079 0.203612 -2.554264 0.0185 R-squared 0.998698 Mean dependent var 26697.20 Adjusted R-squared 0.998512 S.D. dependent var 25384.37 S.E. of regression 979.2577 Akaike info criterion 16.75711 Sum squared resid 20137857 Schwarz criterion 16.95213 Log likelihood -205.4639 F-statistic 5368.622
Durbin-Watson stat 1.759566 Prob(F-statistic) 0.000000 Inverted AR Roots .52
1.00
再用拉格朗日乘数检验自相关是否已消除
含二阶残差项回归结果:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.831638 Probability 0.450575 Obs*R-squared 2.011998 Probability 0.365679
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 06/01/12 Time: 15:27
Variable Coefficient Std. Error t-Statistic Prob.
C 33620447 89317489 0.376415 0.7108
X -0.038309 0.101577 -0.377143 0.7102
AR(1) -0.009663 0.725955 -0.013310 0.9895
AR(2) 0.028647 0.757768 0.037804 0.9702
RESID(-1) 0.157362 0.732418 0.214852 0.8322
RESID(-2) -0.265974 0.409538 -0.649448 0.5238 R-squared 0.080480 Mean dependent var 3.544879 Adjusted R-squared -0.161499 S.D. dependent var 916.0045 S.E. of regression 987.2043 Akaike info criterion 16.83319 Sum squared resid 18516875 Schwarz criterion 17.12572 Log likelihood -204.4149 F-statistic 0.332591 Durbin-Watson stat 1.948202 Prob(F-statistic) 0.886935
范文三:【总结】matlab求两个序列的相关性
首先说说自相关和互相关的概念。
自相关
在统计学中的定义,自相关函数就是将一个有序的随机变量系列与其自身作比较。每个不存在相位差的系列,都与其都与其自身相似,即在此情况下,自相关函数值最大。
在信号分析当中通常将自相关函数称之为自协方差方程。 用来描述信息在不同时间的,信息函数值的相关性。
互相关
在统计学中,互相关有时用来表示两个随机矢量 X 和 Y 之间的协方差 cov(X, Y),以与矢量 X的“协方差”概念相区分,矢量 X 的“协方差”是 X 的各标量成分之间的协方差矩阵。
在信号处理领域中,互相关(有时也称为“互协方差”)是用来表示两个信号之间相似性的一个度量,通常通过与已知信号比较用于寻找未知信号中的特性。互相关实质上类似于两个函数的卷积。
对于离散函数 fi 和 gi 来说,互相关定义为
其中和在整个可能的整数 j ?区域取和,星号表示复共轭。
对于连续信号 f (x) 和 g (x) 来说,互相关定义为
其中积分是在整个可能的 t 区域积分。
即互相关函数是描述随机信号x(t),y(t)在任意两个不同时刻t1,t2的取值之间的相关程度,自相关函数是描述随机信号x(t)在任意两个不同时刻t1,t2的取值之间的相关程度。
自相关函数是描述随机信号X(t)在任意两个不同时刻t1,t2的取值之间的相关程度;互相关函数给出了在频域内两个信号是否相关的一个判断指标,把两测点之间信号的互谱与各自的自谱联系了起来。
===============================================================================================
在matlab当中可以使用xcorr函数来求序列的自相关和互相关。
使用方法:
c = xcorr(x,y)?返回矢量长度为2*N-1互相关函数序列,其中x和y的矢量长度均为N,如果x和y的长度不一样,则在短的序列后补零直到两者长度相等。
c = xcorr(x)为矢量x的自相关估计。
c = xcorr(x,y,'option')为有正规化选项的互相关计算;其中选项为"biased"为有偏的互相关函数估计;"unbiased"为无偏的互相关函数估计;"coeff"为0延时的正规化序列的自相关计算;"none"为原始的互相关计算。
在Matalb中,求解xcorr的过程事实上是利用Fourier变换中的卷积定理进行的。
可以查阅这篇博客了解xcorr函数的实现过程:自相关和互相关在matlab中的实现
也可以查阅matlab论坛中教学直接用FFt变换求两个序列互相关的方法:matlab求两个序列的互相关函数
================================================================================================
相关程度与相关函数的之间的联系
在概率论和统计学中,相关(Correlation,或称相关系数或关联系数),显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。最常用的是皮尔逊积矩相关系数。其定义是两个变量协方差除以两个变量的标准差(方差的平方根)。
相关系数只是一个比率,不是等单位量度,无什么单位名称,也不是相关的百分数,一般取小数点后两位来表示。相关系数的正负号只表示相关的方向,绝对值表示相关的程度。因为不是等单位的度量,因而不能说相关系数0.7是0.35两倍,只能说相关系数为0.7的二列变量相关程度比相关系数为0.35的二列变量相关程度更为密切和更高。也不能说相关系数从0.70到0.80与相关系数从0.30到0.40增加的程度一样大。
对于相关系数的大小所表示的意义目前在统计学界尚不一致,但通常按下是这样认为的:
相关系数 ? ??相关程度
0.00-±0.30 ? ?微相关
±0.30-±0.50 ?实相关
±0.50-±0.80 ?显著相关
±0.80-±1.00 ?高度相关
================================================================================================
在matlab中使用corrcoef函数可以求两个序列的相关度
corrcoef(x,y)表示序列x和序列y的相关系数,得到的结果是一个2*2矩阵,其中对角线上的元素分别表示x和y的自相关,非对角线上的元素分别表示x与y的相关系数和y与x的相关系数,两个是相等的。
范文四:m序列的生成及其相关性的matlab分析
%matlab程序:生成m序列和相关性分析
clc;
N=5;
connections=gfprimfd(N,'all');%生成级数为5时所有本原多项式系数序列矩阵 f1=connections(2,:); %取一组本原多项式序列,此系数为45(100101) f2=connections(3,:); %取另一组本原多项式序列,此系数为75(111101) registers1=[0 0 0 0 1];%给定寄存器的初始状态
registers2=[0 0 0 0 1];%取相同的初始状态
L=2^N-1; %周期长度
sum2=0;
sum1=0;
for k=1:L
seq1(k)=registers1(N); %第一组m序列
seq2(k)=registers2(N); %第二组序列
for j=1:N %进行模2加
sum1=sum1+f1(j+1)*registers1(j); %各级寄存器送参与模2加的值 sum1=mod(sum1,2);
sum2=sum2+f2(j+1)*registers2(j); %各级寄存器送参与模2加的值 sum2=mod(sum2,2);
end
for t=N:-1:2 %寄存器移位
registers1(t)=registers1(t-1);
registers2(t)=registers2(t-1);
end
registers1(1)=sum1; registers2(1)=sum2;
sum1=0; sum2=0;
end
disp(f1); %显示反馈系数序列
disp(seq1); %显示第一组m序列
m1=xcorr(seq1,’unbiased’); %计算自相关函数
figure;stem(m1/max(m1));
title('m1的自相关函数'); %画出m1序列的自相关函数
disp(f2);
disp(seq2);
m2=xcorr(seq2,’unbiased’);
figure;stem(m2/max(m2));
title('m2的自相关函数');%画出m2序列的自相关函数
R12= xcorr(seq1,seq2,’unbiased’)
figure;plot(R12/max(R12));
title('m2,m1的互相关函数');%画出m1,m2序列的互相关特性
s=fftshift(abs(fft(seq1,2*L)).^2); s=s/max(s);
figure;plot(s);
分析:由图知m序列具有良好的自相关特性,但其互相关特性并不理想,存在多值
范文五:序列相关性的理论研究与实证检验
序列相关性的理论研究与实证检验
1 序列相关性
多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
序列相关性,在计量经济学中指对于不同的样本值,随机干扰之间不再是完全相互独立的,而是存在某种相关性。又称自相关,是指总体回归模型的随机误差项之间存在相关关系。
对于线性回归模型:
Yi??0??1Xi1??2Xi2????kXik?uii?1,2,?,n
在其他假设仍然成立的条件下,随机干扰项序列相关意味着
Cov(ui,uj)?E(uiuj)?0
或者
??2?E(u1un)???2??1n?????
Var(u)?E(u?u)????????????2???2I
2??E(unu1)???2?????n1???
如果仅存在
E(uiui?1)?0i?1,2,?,n?1
则称存在一阶序列相关或者自相关,这是最常见的一种序列相关问题。自相
关往往可以写成如下形式:
ui??ui?1??i
其中?自协方差系数或者一阶自相关系数,?i是满足以下OLS的随机干扰项:
E(?i)?0,Var(?i)??2,Cov(?i,?i?s)?0(s?0)
序列相关性经常出现在以时间数列为样本的模型中,故在处理时间序列问题时注意序列相关性的检验。
2 序列相关性产生的原因
实际问题中,序列相关性产生的原因主要来自于下面三个方面:
1、 经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。
2、 模型设定的偏误
所谓模型设定偏误是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例如,本来应该估计的模型为:
Yt??0??1Xt1??2Xt2??3Xt3?ut
但在模型设定中做了下述回归:
Yt??0??1Xt1??2Xt2?vt
因此,vt??3Xt3?ut,如果确实影响Y,则出现序列相关,于是在X3确实影响了Y的情况下,这种模型设定的偏误往往是导致随机干扰项中的一个重要的系统性影响因素,使其呈现序列相关性。
3、数据的“编造”
在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
3 序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:
1、参数估计量非有效
当计量经济学模型出现序列相关性时,其普通最小二乘法乘数估计量仍然具有线性无偏性,但不具有有效性。因为,在有效性证明中利用了
E(u?u)??2I
即同方差性和互相独立性条件。
而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。
2、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。如果存在序列相关性,估计的参数方程S??出现偏误,t检验就失去意义,其他检验也是如此。
j
3、模型的预测失效
区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。
4 序列相关性的检验
序列相关性的检验方法主要有以下几种:
1、图示法
?t来做ut的估计,所以用e?t的变化图来判断ut的序列相关性。 用残差e
图1 残差项的序列相关性
2、回归检验法
?t为被解释变量,以各种可能的相关量,建立各种方程: 以e
?t??e?t?1??t e
?t??1e?t?1??2e?t?2??t e
?? 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。
回归检验法的优点是:(1)能够确定序列相关的形式;(2)适用于任何类型序列相关性问题的检验。
3、D.W.检验
D?W检验是杜宾(J.Durbin)和瓦森(G.S. Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:
(1)解释变量X非随机;
(2)随机误差项为一阶自回归形式:
ui??ui?1??i
(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Yi??0??1Xi1??2Xi2????kXik??Yt?1?ui
(4)回归含有截距项 D.W.检验的步骤: (1)计算D.W值
(2)给定?,由n和k的大小查D.W分布表,得临界值dU和dL (3)比较、判断
D.W.4、序列相关的补救
如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。最常用的方法是广义最小二乘法和广义差分法。
1、广义最小二乘法 对于模型
Y?X??u
如果存在序列相关,同时存在异方差,即有:
2
??1?12?2?21?2?Cov(μμ,?)?E(μμ,?)?
???????n1?n2
显然?是对称正定矩阵,存在可逆矩阵D,使得
??DD?
根据新的模型:
????
?1n?
??2n?
??2??n??
??2Ω
D?1Y?D?1X??D?1u
即
Y*?X*??u*
?是无偏的,有效的估计量。 可以用普通最小二乘法估计,参数估计量?*
2、广义差分法
广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。 如果原模型
Yi??0??1X1i??2X2i????kXki??i
存在
?t??1?t?1??2?t?2????l?t?l??t
可以将原模型变换为:
Yt??1Yt?1????lYt?l??0(1??1????l)??1(X1t??1X1t?1????lX1t?l)
????k(Xkt??1Xkt?1????lXkt?l)??t
该模型为广义差分模型,不存在序列相关问题。可进行OLS估计。
5 实证分析
工业增加值主要由全社会固定资产投资决定。为了考察全社会固定资产投资对工业增加值的影响。
表2 中国1998-2000的全社会固定资产投资与工业增加值的统计数据(亿元)
数据来源:李子奈《计量经济学》
1、图示检验法
图2 残差项的序列相关性
通过残差与残差滞后一期的散点图可以判断,随机干扰项存在正序列相关性。 2、对数模型最小二乘法估计
当设定的模型为lnyt??0+?1lnxt?ut,利用EVIEWS进行序列相关性检验:结果如下:
可以将原模型变换为:
Yt??1Yt?1????lYt?l??0(1??1????l)??1(X1t??1X1t?1????lX1t?l)
????k(Xkt??1Xkt?1????lXkt?l)??t
该模型为广义差分模型,不存在序列相关问题。可进行OLS估计。 5 实证分析
工业增加值主要由全社会固定资产投资决定。为了考察全社会固定资产投资对工业增加值的影响。
表2 中国1998-2000的全社会固定资产投资与工业增加值的统计数据(亿元)
数据来源:李子奈《计量经济学》
1、图示检验法
图2 残差项的序列相关性
通过残差与残差滞后一期的散点图可以判断,随机干扰项存在正序列相关性。
2、对数模型最小二乘法估计
当设定的模型为lnyt??0+?1lnxt?ut,利用EVIEWS进行序列相关性检验:结果如下:
表3 序列相关性检验结果
据上表所示,D.W统计量的值为0.48。在5%的显著水平下,样本容量为21的D.W分布的上限和下限分别为:1.42和1.22。0.48小于1.22,0?DW.?dL,则存在正自相关。
3、广义最小二乘法估计
若按ut??ut?1??t,用广义最小二乘法估计原模型
结果如下:
表4 广义最小二乘法估计结果
根据LM法进行检验:
表5 LM法检验结果
根据以上结果显示,模型随机干扰项中不再存在一阶序列相关,所以广义最小二乘法估计结果如下:
lnyt?1.08?0.909lnxt+0.656AR(1)
4、差分模型估计
*采用差分形式x*
t?xt?x?t1与yt?yt?yt?1作为新数据,估计模型
yt*??0??1xt*??t
得到的运行结果如下:
表6差分模型估计结果
D.W检验值为1.6。样本容量为20的D.W分布的上限和下限分别为:1.41和1.20。大于临界值上限1.41,小于4-1.41=2.59,D.W在dU?DW.?4?dU内,因此差分后构建的模型不存在序列相关。估计方程为:
yt*?292.69?1.006xt*??t
6 实验结果及分析
多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关,如果模型的随机干扰项违背了相互独立的基本假设,则称该模型的随机干扰项存在序列相关性。
序列相关性检验方法的共同思路是:首先采用普通最小二乘法估计模型,以求得随机干扰项的“近似估计量”,然后通过分析这些“近似估计量”之间的相关性以达到判断随机干扰项是否具有序列相关性的目的。
序列相关性的检验方法有:图示法、回归检验法、D.W检验法。序列相关性有广义最小二乘法,广义差分法,序列相关稳健标误法等补救方法。
其中广义差分法是一种克服序列相关行的有效方法,被广泛的采用,它是将原模型变换为满足最小二乘法的差分模型,再进行普通最小二乘估计。
通过以上的分析结果可以看出原模型是存在序列相关性的,如果采用广义差分法和差分模型,可以消除模型的序列相关性。
转载请注明出处范文大全网 » 序列相关性的检验与修正