步骤一:分析数据的平稳性(单位根检验)
按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。
因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。
单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。
由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。
其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z统计量,并
且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程, Hadri Z统计量的检验原假设为不存在普通的单位根过程。
有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC(Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。
如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距项,T&I代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。
但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们才认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。
此外,单位根检验一般是先从水平(level)序列开始检验起,如果存在单位根,则对该序列进行一阶差分后继续检验,若仍存在单位根,则进行二阶甚至高阶差分后检验,直至序列平稳为止。我们记I(0)为零阶单整,I(1)为一阶单整,依次类推,I(N)为N阶单整。
步骤二:协整检验或模型修正
情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。
但也有如下的宽限说法:如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高于被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相同。
也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响
不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。
协整检验方法的文献综述:(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF和ADF检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同的是,Pedroni的检验方法允许异质面板的存在。(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。
我们主要采用的是Pedroni、Kao、Johansen的方法。
通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。
这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提是变量协整)。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格兰杰因果检验的,不过此时可以先对数据进行处理。引用张晓峒的原话,“如果y和x不同阶,不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要看它们此时有无经济意义。”
下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定不变的条件下,如果一个事件X的发生与不发生对于另一个事件Y的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又有先后顺序(A前B后),那么我们便可以说X是Y的原因。考虑最简单的形式,Granger检验是运用F-统计量来检验X的滞后值是否显著影响Y(在统计的意义下,且已经综合考虑了Y的滞后值;如果影响不显著,那么称X不是Y的“Granger原因”(Granger cause);如果影响显著,那么称X是Y的“Granger原因”。同样,这也可以用于检验Y是X的“原因”,检验Y的滞后值是否影响X(已经考虑了X的滞后对X自身的影响)。
Eviews好像没有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。说明Eviews是无法对面板数据序列做格兰杰检验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews中是
针对普通的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话,不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group),再来试试。
情况二:如果如果基于单位根检验的结果发现变量之间是非同阶单整的,即面板数据中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序列进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分某些序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列进行二阶差分,因为对变动数据或增长率数据再进行差分,我们不好对其冠以经济解释。难道你称其为变动率的变动率?
步骤三:面板模型的选择与回归
面板数据模型的选择通常有三种形式:
一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。
一种是固定效应模型(Fixed Effects Regression Model)。又分为三种:时期固定效应、个体固定效应、时间个体双固定效应。这是文献中常常被人忽视的,但是如果在空间面板数据下,这种区分非常必要和有价值!而在stata中实现有一定的难度。固定效应的各种模型的选择用固定效应的F检验实现。
对于混合回归和固定效应的选择一般采用Wald检验或者似然比检验。
如果对于不同的截面或不同的时间序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回归参数。一种是随机效应模型(Random Effects Regression Model)。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态分布,则固定效应模型就变成了随机效应模型。
在面板数据模型形式的选择方法上,我们经常采用F检验决定选用混合模型还是固定效应模型,然后用Hausman检验确定应该建立随机效应模型还是固定效应模型。
检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归:
在回归的时候,权数可以选择按截面加权(cross-section weights)的方式,对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差现象。估计方法采用PCSE(Panel Corrected Standard Errors,面板校正标准误)方法。Beck和Katz(1995)引入的PCSE估计方法是面板数据模型估计方法的
一个创新,可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本量不够大时尤为有用。
面板数据回归分析实例 面板数据模型实例分析
导读:就爱阅读网友为您分享以下“面板数据模型实例分析”的资讯,希望对您有所帮助,感谢您对92to.com的支持!
1.已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp,不变价格)和人均收入(ip,不变价格)居民,利用数据(1)建立面板数据(panel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。
年人均消费(consume)和人均收入(income)数据以及消费者价格指数(p)分别见表9.1,9.2和9.3。
表9.1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据
人均消费 CONSUMEAH CONSUMEBJ CONSUMEFJ
CONSUMEHB CONSUMEJL CONSUMEJS
1
CONSUMEJX CONSUMELN CONSUMESD
CONSUMESH CONSUMESX CONSUMETJ
CONSUMEZJ
1996
1997
1998
1999
2000
2001
2002
3607.43 3693.55 3777.41 3901.81 4232.98 4517.65 4736.52 5729.52 6531.81 6970.83 7498.48 8493.49 8922.72 10284.6 4248.47 4935.95 5181.45 5266.69 5638.74 6015.11 6631.68 3424.35 4003.71 3834.43 4026.3 4348.47 4479.75 5069.28
2
3037.32 3408.03 3449.74 3661.68 4020.87 4337.22 4973.88 4057.5 4533.57 4889.43 5010.91 5323.18 5532.74 6042.6 2942.11 3199.61 3266.81 3482.33 3623.56 3894.51 4549.32 3493.02 3719.91 3890.74 3989.93 4356.06 4654.42 5342.64 3770.99 4040.63 4143.96 4515.05
5022
5252.41 5596.32
10464
CONSUMEHLJ 3110.92 3213.42 3303.15 3481.74 3824.44 4192.36 4462.08
CONSUMENMG 2767.84 3032.3 3105.74 3468.99 3927.75 4195.62 4859.88
6763.12 6819.94 6866.41 8247.69 8868.19 9336.1
3035.59 3228.71 3267.7 3492.98 3941.87 4123.01 4710.96 4679.61 5204.15 5471.01 5851.53 6121.04 6987.22 7191.96
3
5764.27 6170.14 6217.93 6521.54 7020.22 7952.39 8713.08
表9.2 1996—2002年中国东北、华北、华东15个省级地区
的居民家庭人均收入(元)数据
人均收入
1996
1997
1998
1999 5064.6
2000 5293.55 7432.26 5661.16 4912.88 4810 6800.23 5103.58 5357.79 5129.05 6489.97 4724.11 8140.5
2001 5668.8 8313.08 5984.82 5425.87 5340.46 7375.1 5506.02 5797.01 5535.89 7101.08 5391.05 8958.7
4
2002 6032.4 9189.36 6679.68 6100.56 6260.16 8177.64 6335.64 6524.52 6051 7614.36 6234.36 9337.56
INCOMEAH 4512.77 4599.27 4770.47
INCOMEBJ 7332.01 7813.16 8471.98 9182.76 10349.69 11577.78 12463.92 INCOMEFJ 5172.93 6143.64 6485.63 6859.81 INCOMEHB 4442.81 4958.67 5084.64 5365.03 INCOMEHLJ 3768.31 4090.72 4268.5 INCOMEJS 5185.79 5765.2 6017.85 INCOMEJX
4595.14 6538.2
INCOMEJL 3805.53 4190.58 4206.64 4480.01
3780.2 4071.32 4251.42 4720.58
INCOMELN 4207.23 4518.1 4617.24 4898.61
INCOMENMG 3431.81 3944.67 4353.02 4770.53 INCOMESD 4890.28 5190.79 5380.08 5808.96 INCOMESX 3702.69 3989.92 4098.73 4342.61 INCOMETJ 5967.71 6608.39 7110.54 7649.83 INCOMEZJ 6955.79 7358.72
5
7836.76 8427.95
INCOMESH 8178.48 8438.89 8773.1 10931.64 11718.01
12883.46 13249.8
9279.16 10464.67 11715.6
表9.3 1996—2002年中国东北、华北、华东15个省级地区
的消费者物价指数
物价指数 1996 PAH PBJ PFJ PHB PHLJ PJL PJS PJX PLN PNMG PSD PSH PSX PTJ PZJ
1997
1998 100
1999
2000
6
2001
2002 99 99.5 99
109.9 101.3
97.8 100.7 100.5 99.1 102.1 98.7 98.1 98
99.7 100.5
111.6 105.3 102.4 100.6 103.5 103.1 98.2 105.9 101.7 99.7 107.1 103.5 98.4 107.2 103.7 99.2 109.3 101.7 99.4 108.4
102
101
107.9 103.1 99.3 107.6 104.5 99.3 109.6 102.8 99.4 109.2 102.8 109
100
7
107.9 103.1 98.6
103.1 99.5
107.9 102.8 99.7
107.1 104.4 100.4 96.8 98.3 100.8 99.3 98.6 101.3 99.5
98.7 100.1 100.8 99.2 98.6 100.3 99.5 100.1 98.6
99.9
100
98.9
99.8 101.3 100.6 100.2 99.3 100.2 101.8 99.3 101.5 102.5 98.9 98.8
100
100.5 98.4 99.1
8
99.6 103.9 99.8
101
99.8
99.6 101.2 99.6
(1)建立面板数据工作文件
首先建立工作文件。打开工作文件后,过程如下:
建立面板数据库。
在窗口中输入15个不同省级地区的标识。
(2)定义序列名并输入数据
9
10
我国医药产业内贸易面板数据回归分析
龙源期刊网 http://www.qikan.com.cn
我国医药产业内贸易面板数据回归分析 作者:张昊 褚淑贞
来源:《现代商贸工业》2013年第06期
摘 要: 研究了我国医药产业内贸易情况,将产业内贸易的影响因素与医药产业内贸易指数进行计量经济学分析,证明各影响因素对产业内贸易指数的影响及原因。
关键词: 面板数据;产业内贸易
中图分类号: F74
文献标识码: A
文章编号: 16723198(2013)06006001
0 引言
产品特征和国家特征共同影响产业内贸易。产品方面包括产品差别成度、规模经济、市场结构、国际直接投资等。国家特征包括国家规模和发展程度以及人均国民收入和分配方式。 1 我国医药行业产业内贸易情况
选取GL 指数用于我国医药行业产业内贸易的衡量方法。根据GL 指数法分别计算历年医药行业6个子目2002至2011年的产业内贸易水平,并以各个子目进出口总额占当年钢铁行业全部进出口额的比例为权数,计算我国医药产业内贸易的总体水平。计算结果显示,我国医药行业产业内贸易指数历年在0和1之间,这说明我国医药产品均存在产业内贸易与产业间贸易的共存。但这10年来我国医药行业的产业内贸易指数普遍高于0.65,说明我国医药行业产业内贸易水平较高。从产业内贸易水平的发展趋势来看,总体上我国医药行业产业内贸易水平是下降的,从2002年的0.82下降到2011年的0.69。
2 我国医药产业内贸易的回归分析
选取变量:BL (产业内贸易指数);AGDP (市场平均规模);DGDP (市场规模差异);DPERSON (人均收入差异);SE (规模经济);OP (对外开放度);FDI (国际直接投资);DISTANCE (两国间距离)。选取与我国医药贸易额较大的10个国家为研究对象,分别是意大利、美国、日本、韩国、德国、法国、瑞士、英国、荷兰和印度。在时间选取上,本文选取2002年至2011年这十年的贸易数据为研究对象。通过回归分析可知,模型整体拟和情况较好,R 达到0.86,F 值为80,对方程的回归效果较好。回归结果及回归结果系数分析如下:
面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)
面板数据分?析简要步骤?与注意事项?
(面板单位根?—面板协整—回归分析) 步骤一:分析数据的?平稳性(单位根检验?)
按照正规程?序,面板数据模?型在回归前?需检验数据?的平稳性。李子奈曾指?出,一些非平稳?的经济时间?序列往往表?现出共同的?变化趋势,而这些序列?间本身不一?定有直接的?关联,此时,对这些数据?进行回归,尽管有较高?的R平方,但其结果是?没有任何实?际意义的。这种情况称?为称为虚假?回归或伪回?归(spuri?ous regre?ssion?)。他认为平稳?的真正含义?是:一个时间序?列剔除了不?变的均值(可视为截距?)和时间趋势?以后,剩余的序列?为零均值,同方差,即白噪声。因此单位根?检验时有三?种检验模式?:既有趋势又?有截距、只有截距、以上都无。 因此为了避?免伪回归,确保估计结?果的有效性?,我们必须对?各面板序列?的平稳性进?行检验。而检验数据?平稳性最常?用的办法就?是单位根检?验。首先,我们可以先?对面板序列?绘制时序图?,以粗略观测?时序图中由?各个观测值?描出代表变?量的折线是?否含有趋势?项和(或)截距项,从而为进一?步的单位根?检验的检验?模式做准备?。
单位根检验?方法的文献?综述:在非平稳的?面板数据渐?进过程中,Levin? andLi?n(1993) 很早就发现?这些估计量?的极限分布?是高斯分布?,这些结果也?被应用在有?异方差的面?板数据中,并建立了对?面板单位根?进行检验的?早期版本。后来经过L?evin et al. (2002)的改进,提出了检验?面板单位根?的LLC 法。Levin? et al. (2002) 指出,该方法允许?不同截距和?时间趋势,异方差和高?阶序列相关?,适合于中等?维度(时间序列介?于25,250 之间,截面数介于?10,250 之间) 的面板单位?根检验。Im et al. (1997) 还提出了检?验面板单位?根的IPS?法,但Brei?tung(2000) 发现IPS?法对限定性?趋势的设定?极为敏感,并提出了面?板单位根检?验的Bre?itung? 法。Madda?la and Wu(1999)又提出了A?DF-Fishe?r和PP-Fishe?r面板单位?根检验方法?。
由上述综述?可知,可以使用L?LC、IPS、Brein?tung、ADF-Fishe?r 和PP-Fishe?r5种方法?进行面板单?位根检验。其中LLC?-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Le?vin, Lin & Chu t* 统计量、Breit?ung t 统计量、lm Pesar?an & Shin W 统计量、ADF- Fishe?r Chi-squar?e统计量、PP-Fishe?r Chi-squar?e统计量、Hadri? Z统计量,并且Lev?in, Lin & Chu t* 统计量、Breit?ung t统计量的?原假设为存?在普通的单?位根过程,lm Pesar?an & Shin W 统计量、ADF- Fishe?r Chi-squar?e统计量、PP-Fishe?r Chi-squar?e统计量的?原假设为存?在有效的单?位根过程, Hadri? Z统计量的?检验原假设?为不存在普?通的单位根?过程。
有时,为了方便,只采用两种?面板数据单?位根检验方?法,即相同根单?位根检验L?LC(Levin?-Lin-Chu)检验和不同?根单位根检?验Fish?er-ADF检验?(注:对普通序列?(非面板序列?)的单位根检?验方法则常?用ADF检?验),如果在两种?检验中均拒?绝存在单位?根的原假设?则我们说此?序列是平稳?的,反之则不平?稳。 如果我们以?T(trend?)代表序列含?趋势项,以I(inter?cept)代表序列含?截距项,T&I代表两项?都含,N(none)代表两项都?不含,那么我们可?以基于前面?时序图得出?的结论,在单位根检?验中选择相?应检验模式?。
但基于时序?图得出的结?论毕竟是粗?略的,严格来说,那些检验结?构均需一一?检验。具体操作可?以参照李子?奈的说法:ADF检验?是通过三个?模型来完成?,首先从
含有?截距和趋势?项的模型开?始,再检验只含?截距项的模?型,最后检验二?者都不含的?模型。并且认为,只有三个模?型的检验结?果都不能拒?绝原假设时?,我们才认为?时间序列是?非平稳的,而只要其中?有一个模型?的检验结果?拒绝了零假?设,就可认为时?间序列是平?稳的。
此外,单位根检验?一般是先从?水平(level?)序列开始检?验起,如果存在单?位根,则对该序列?进行一阶差?分后继续检?验,若仍存在单?位根,则进行二阶?甚至高阶差?分后检验,直至序列平?稳为止。我们记I(0)为零阶单整?,I(1)为一阶单整?,依次类推,I(N)为N阶单整?。
步骤二:协整检验或?模型修正
情况一:如果基于单?位根检验的?结果发现变?量之间是同?阶单整的,那么我们可?以进行协整?检验。协整检验是?考察变量间?长期均衡关?系的方法。所谓的协整?是指若两个?或多个非平?稳的变量序?列,其某个线性?组合后的序?列呈平稳性?。此时我们称?这些变量序?列间有协整?关系存在。因此协整的?要求或前提?是同阶单整?。 但也有如下?的宽限说法?:如果变量个?数多于两个?,即解释变量?个数多于一?个,被解释变量?的单整阶数?不能高于任?何一个解释?变量的单整?阶数。另当解释变?量的单整阶?数高于被解?释变量的单?整阶数时,则必须至少?有两个解释?变量的单整?阶数高于被?解释变量的?单整阶数。如果只含有?两个解释变?量,则两个变量?的单整阶数?应该相同。
也就是说,单整阶数不?同的两个或?以上的非平?稳序列如果?一起进行协?整检验,必然有某些?低阶单整的?,即波动相对?高阶序列的?波动甚微弱?(有可能波动?幅度也不同?)的序列,对协整结果?的影响不大?,因此包不包?含的重要性?不大。而相对处于?最高阶序列?,由于其波动?较大,对回归残差?的平稳性带?来极大的影?响,所以如果协?整是包含有?某些高阶单?整序列的话?(但如果所有?变量都是阶?数相同的高?阶,此时也被称?作同阶单整?,这样的话另?当别论),一定不能将?其纳入协整?检验。
协整检验方?法的文献综?述:(1)Kao(1999)、Kao and Chian?g(2000)利用推广的?DF和AD?F检验提出?了检验面板?协整的方法?,这种方法零?假设是没有?协整关系,并且利用静?态面板回归?的残差来构?建统计量。(2)Pedro?n(1999)在零假设是?在动态多元?面板回归中?没有协整关?系的条件下?给出了七种?基于残差的?面板协整检?验方法。和Kao的?方法不同的?是,Pedro?ni的检验?方法允许异?质面板的存?在。(3)Larss?on et al(2001)发展了基于?Johan?sen(1995)向量自回归?的似然检验?的面板协整?检验方法,这种检验的?方法是检验?变量存在共?同的协整的?秩。
主要采用的?是Pedr?oni、Kao、Johan?sen的方?法。
通过了协整?检验,说明变量之?间存在着长?期稳定的均?衡关系,其方程回归?残差是平稳?的。因此可以在?此基础上直?接对原方程?进行回归,此时的回归?结果是较精?确的。
这时,我们或许还?想进一步对?面板数据做?格兰杰因果?检验(因果检验的?前提是变量?协整)。但如果变量?之间不是协?整(即非同阶单?整)的话,是不能进行?格兰杰因果?检验的,不过此时可?以先对数据?进行处理。引用张晓峒?的原话,“如果y和x?不同阶,不能做格兰?杰因果检验?,但可通过差?分序列或其?他处理得到?同阶单整序?列,并且要看它?们此时有无?经济意义。”
下面简要介?绍一下因果?检验的含义?:这里的因果?关系是从统?计角度而言?的,即
是通过概?率或者分布?函数的角度?体现出来的?:在所有其它?事件的发生?情况固定不?变的条件下?,如果一个事?件X的发生?与不发生对?于另一个事?件Y的发生?的概率(如果通过事?件定义了随?机变量那么?也可以说分?布函数)有影响,并且这两个?事件在时间?上又有先后?顺序(A前B后),那么我们便?可以说X是?Y的原因。考虑最简单?的形式,Grang?er检验是?运用F-统计量来检?验X的滞后?值是否显著?影响Y(在统计的意?义下,且已经综合?考虑了Y的?滞后值;如果影响不?显著,那么称X不?是Y的“Grang?er原因”(Grang?er cause?);如果影响显?著,那么称X是?Y的“Grang?er原因”。同样,这也可以用?于检验Y是?X的“原因”,检验Y的滞?后值是否影?响X(已经考虑了?X的滞后对?X自身的影?响)。
Eview?s好像没有?在POOL?窗口中提供?Grang?er causa?lity test,而只有un?it root test和?coint?egrat?ion test。说明Evi?ews是无?法对面板数?据序列做格?兰杰检验的?,格兰杰检验?只能针对序?列组做。也就是说格?兰杰因果检?验在Evi?ews中是?针对普通的?序列对(pairw?ise)而言的。你如果想对?面板数据中?的某些合成?序列做因果?检验的话,不妨先导出?相关序列到?一个组中(POOL窗?口中的Pr?oc/Make Group?),再来试试。
情况二:如果如果基?于单位根检?验的结果发?现变量之间?是非同阶单?整的,即面板数据?中有些序列?平稳而有些?序列不平稳?,此时不能进?行协整检验?与直接对原?序列进行回?归。但此时也不?要着急,我们可以在?保持变量经?济意义的前?提下,对我们前面?提出的模型?进行修正,以消除数据?不平稳对回?归造成的不?利影响。如差分某些?序列,将基于时间?频度的绝对?数据变成时?间频度下的?变动数据或?增长率数据?。此时的研究?转向新的模?型,但要保证模?型具有经济?意义。因此一般不?要对原序列?进行二阶差?分,因为对变动?数据或增长?率数据再进?行差分,我们不好对?其冠以经济?解释。难道你称其?为变动率的?变动率,
步骤三:面板模型的?选择与回归?
面板数据模?型的选择通?常有三种形?式:
一种是混合?估计模型(Poole?d Regre?ssion? Model?)。如果从时间?上看,不同个体之?间不存在显?著性差异;从截面上看?,不同截面之?间也不存在?显著性差异?,那么就可以?直接把面板?数据混合在?一起用普通?最小二乘法?(OLS)估计参数。一种是固定?效应模型(Fixed? Effec?ts Regre?ssion? Model?)。如果对于不?同的截面或?不同的时间?序列,模型的截距?不同,则可以采用?在模型中添?加虚拟变量?的方法估计?回归参数。一种是随机?效应模型(Rando?m Effec?ts Regre?ssion? Model?)。如果固定效?应模型中的?截距项包括?了截面随机?误差项和时?间随机误差?项的平均效?应,并且这两个?随机误差项?都服从正态?分布,则固定效应?模型就变成?了随机效应?模型。 在面板数据?模型形式的?选择方法上?,我们经常采?用F检验决?定选用混合?模型还是固?定效应模型?,然后用Ha?usman?检验确定应?该建立随机?效应模型还?是固定效应?模型。
检验完毕后?,我们也就知?道该选用哪?种模型了,然后我们就?开始回归: 在回归的时?候,权数可以选?择按截面加?权(cross?-secti?on weigh?ts)的方式,对于横截面?个数大于时?序个数的情?况更应如此?,表示允许不?同的截面存?在异方差现?象。估计方法采?用PCSE?(Panel? Corre?cted Stand?ard Error?s,面板校正标?准误)方
法。Beck和?Katz(1995)引入的PC?SE估计方?法是面板数?据模型估计?方法的一个?创新,可以有效的?处理复杂的?面板误差结?构,如同步相关?,异方差,序列相关等?,在样本量不?够大时尤为?有用。
这是我在查?阅各种资料?后得出的关?于面板数据?的总结,最近在做面?板的实证论?文,所以需要这?个,欢迎大家继?续扩充,只要是关于?面板的都行?,关于具体如?何在Evi?ews6中?实现的更好?,不甚感激。
----------
*横截面的异?方差与序列?的自相关性?是运用面板?数据模型时?可能遇到的?最为常见的?问题,此时运用O?LS可能会?产生结果失?真,因此为了消?除影响,对我国东、中、西部地区的?分析将采用?不相关回归?方法( Seemi?nglyU?nrela?ted Regre?ssion?, SUR)来估计方程?。而对于全国?范围内的估?计来说,由于横截面?个数大于时?序个数,所以采用截?面加权估计?法(Cross? Secti?onWei?ghts, CSW) 。
*一般而言,面板数据可?用固定效应?(fixed? effec?t) 和随机效应?(rando?m effec?t) 估计方法,即如果选择?固定效应模?型,则利用虚拟?变量最小二?乘法(LSDV) 进行估计;如果选择随?机效应模型?,则利用可行?的广义最小?二乘法(FGLS) 进行估计(Green?e ,2000) 。它可以极大?限度地利用?面板数据的?优点,尽量减少估?计误差。至于究竟是?采用固定效?应还是随机?效应,则要看Ha?usman? 检验的结果?。
*单位根检验?:在进行时间?序列的分析?时,研究者为了?避免伪回归?问题,会通过单位?根检验对数?据平稳性进?行判断。但对于面板?数据则较少?关注。随着面板数?据在经济领?域应用,对面板数据?单位根的检?验也逐渐引?起重视。面板数据单?位根的检验?主要有Le?vin、Lin 和Chu 方法(LLC 检验) (1992 ,1993 ,2002) 、Im、Pesar?an 和Shin?方法( IPS 检验) (1995 ,1997) 、Madda?la 和Wu 方法(MW检验) (1999) 等。 *协整检验:协整检验是?考察变量间?长期均衡关?系的方法。在进行了各?变量的单位?根检验后,如果各变量?间都是同阶?单整,那么就可以?进行协整检?验了。面板协整检?验理论目前?还不成熟,仍然在不断?的发展过程?中,目前的方法?主要有: (1)Kao(1999)、Kao and Chian?g(2000)利用推广的?DF和AD?F检验提出?了检验面板?协整的方法?,这种方法零?假设是没有?协整关系,并且利用静?态面板回归?的残差来构?建统计量。
(2)Pedro?n(i1999?)在零假设是?在动态多元?面板回归中?没有协整关?系的条件下?给出了七种?基于残差的?面板协整检?验方法。和Kao的?方法不同的?是,Pedro?ni的检验?方法允许异?质面板的存?在。
(3)Larss?on et a(l2001?)发展了基于?Johan?sen(1995)向量自回归?的似然检验?的面板协整?检验方法。这种检验的?方法是检验?变量存在共?同的协整的?秩。 *一般的顺序?是:先检验变量?的平稳性,当变量均为?同阶单整变?量时,再采用协整?检验以判别?变量间是否?存在长期均?衡关系。如果变量间?存在长期均?衡的关系,我们可以通?过误差修正?模型(ECM) 来检验变量?间的长期因?果关系;如变量间不?存在协整关?系,我们将对变?量进行差分?,然后通过向?量自回归模?型(VAR),检验变量间?的短期因果?关系。
面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)
面板数据分析简要步骤与注意事项(面板单位根检验 —面板协整—回归分析)
面板数据分析方法:
面板单位根检验—若为同阶—面板协整—回归分析 —若为不同阶—序列变化—同阶建模
随机效应模型与固定效应模型的区别不体现为 R2的大小,固定效应模型为误差项和解 释变量是相关, 而随机效应模型表现为误差项和解释变量不相关。 先用 hausman 检验是 fixed 还是 random ,面板数据 R-squared 值对于一般标准而言,超过 0.3为非常优秀的模型。不是 时间序列那种接近 0.8为优秀。另外,建议回归前先做 stationary 。很想知道随机效应应该 看哪个 R 方?很多资料说固定看 within ,随机看 overall ,我得出的 overall 非常小 0.03,然 后 within 是 53%。 fe 和 re 输出差不多,不过 hausman 检验不能拒绝,所以只能是 re 。该如 何选择呢?
步骤一:分析数据的平稳性(单位根检验)
按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出, 一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定 有直接的关联,此时,对这些数据进行回归,尽管有较高的 R 平方,但其结果是没 有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression) 。 他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间 趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检 验模式:既有趋势又有截距、只有截距、以上都无。
因此 为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平 稳性进行检验。 而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以 先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线 是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中 ,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布 , 这些结果也被应用在有异方差的面 板数据中 , 并建立了对面板单位根进行检验的早期版本。 后来经过 Levin et al. (2002)的改进 , 提出了检验面板单位根的 LLC 法。 Levin et al. (2002) 指出 , 该方法允许不同 截距和时间趋势 , 异方差和高阶序列相关 , 适合于中等维度 (时间序列介于 25~250 之间 , 截面数介于 10~250 之间 ) 的面板单位根检验。 Im et al. (1997) 还提出了检 验面板单位根的 IPS 法 , 但 Breitung(2000) 发现 IPS 法对限定性趋势的设定极为敏 感 , 并提出了面板单位根检验的 Breitung 法。 Maddala and Wu(1999)又提出了 ADF-Fisher 和 PP-Fisher 面板单位根检验方法。
由上述综述可知, 可以使用 LLC 、 IPS 、 Breintung 、 ADF-Fisher 和 PP-Fisher5种方法进行面板单位根检验。
其中 LLC-T 、 BR-T 、 IPS-W 、 ADF-FCS 、 PP-FCS 、 H-Z 分别指 Levin, Lin & Chu t*
统计量、 Breitung t 统计量、 lm Pesaran & Shin W 统计量、 ADF- Fisher Chi-square统计量、 PP-Fisher Chi-square统计量、 Hadri Z统计量, 并且 Levin, Lin & Chu t* 统 计量、 Breitung t统计量的原假设为存在普通的单位根过程, lm Pesaran & Shin W 统 计量、 ADF- Fisher Chi-square统计量、 PP-Fisher Chi-square统计量的原假设为存 在有效的单位根过程, Hadri Z统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检 验 LLC (Levin-Lin-Chu )检验和不同根单位根检验 Fisher-ADF 检验(注:对普 通序列(非面板序列)的单位根检验方法则常用 ADF 检验) ,如果在两种检验中均 拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳 。
如果我们以 T (trend )代表序列含趋势项,以 I (intercept )代表序列含截距项, T&I代表两项都含, N (none )代表两项都不含,那么我们可以基于前面时序图得 出的结论,在单位根检验中选择相应检验模式。
但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一 检验。具体操作可以参照李子奈的说法:ADF 检验是通过三个模型来完成,首先从 含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的 模型。并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们才认为时间 序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间 序列是平稳的。
此外,单位根检验一般是先从水平(level )序列开始检验起,如果存在单位 根,则对该序列进行一阶差分后继续检验,若仍存在单位根,则进行二阶甚至高阶 差分后检验,直至序列平稳为止。我们记 I(0)为零阶单整, I(1)为一阶单整,依次 类推, I(N)为 N 阶单整。
步骤二:协整检验或模型修正
情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们 可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指 若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称 这些变量序列间有协整关系存在。因此 协整的要求或前提是同阶单整。
但也有如下的宽限说法:如果变量个数多于两个, 即解释变量个数多于一个, 被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单 整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高于 被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相 同。
也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验, 必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不 同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最 高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整 是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被 称作同阶单整,这样的话另当别论) ,一定不能将其纳入协整检验。
协整检验方法的文献综述:(1)Kao(1999)、 Kao and Chiang(2000)利用推广 的 DF 和 ADF 检验提出了检验面板协整的方法 , 这种方法零假设是没有协整关系 , 并且 利用静态面板回归的残差来构建统计量。 (2)Pedron(1999)在零假设是在动态多元面
板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和 Kao 的方法不同的是 ,Pedroni 的检验方法允许异质面板的存在。 (3)Larsson et al(2001)发展了基于 Johansen(1995)向量自回归的似然检验的面板协整检验方法, 这种检验 的方法是检验变量存在共同的协整的秩。
主要采用的是 Pedroni 、 Kao 、 Johansen 的方法。
通过了协整检验, 说明变量之间存在着长期稳定的均衡关系, 其方程回归残 差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精 确的。
这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提是变量 协整) 。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格兰杰因果检 验的,不过此时可以先对数据进行处理。引用张晓峒的原话, “ 如果 y 和 x 不同阶, 不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要 看它们此时有无经济意义。 ”
下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的, 即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定不 变的条件下,如果一个事件 X 的发生与不发生对于另一个事件 Y 的发生的概率(如 果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时 间上又有先后顺序 (A 前 B 后) , 那么我们便可以说 X 是 Y 的原因。 考虑最简单的形 式, Granger 检验是运用 F-统计量来检验 X 的滞后值是否显著影响 Y (在统计的意 义下, 且已经综合考虑了 Y 的滞后值; 如果影响不显著, 那么称 X 不是 Y 的 “Granger 原因 ” (Granger cause) ;如果影响显著,那么称 X 是 Y 的 “Granger 原因 ” 。同样, 这也可以用于检验 Y 是 X 的 “ 原因 ” ,检验 Y 的滞后值是否影响 X (已经考虑了 X 的 滞后对 X 自身的影响) 。
Eviews 好像没有在 POOL 窗口中提供 Granger causality test,而只有 unit root test和 cointegration test。 说明 Eviews 是无法对面板数据序列做格兰杰检验的, 格兰杰 检验只能针对序列组做。 也就是说格兰杰因果检验在 Eviews 中是针对普通的序列对 (pairwise)而言的。 你如果想对面板数据中的某些合成序列做因果检验的话, 不妨先 导出相关序列到一个组中 (POOL窗口中的 Proc/Make Group),再来试试。
情况二:如果如果基于单位根检验的结果发现变量之间是非同阶单整的,即 面板数据中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序 列进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们 前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分某些 序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时 的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列进行二 阶差分,因为对变动数据或增长率数据再进行差分,我们不好对其冠以经济解释。 难道你称其为变动率的变动率?
步骤三:面板模型的选择与回归
面板数据模型的选择通常有三种形式:
一种是混合估计模型(Pooled Regression Model) 。如果从时间上看,不同个
体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么 就可以直接把面板数据混合在一起用普通最小二乘法(OLS )估计参数。一种是固 定效应模型(Fixed Effects Regression Model) 。如果对于不同的截面或不同的时间 序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回归参数。 一种是随机效应模型(Random Effects Regression Model) 。如果固定效应模型中的 截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这两个随机误差 项都服从正态分布,则固定效应模型就变成了随机效应模型。
在面板数据模型形式的选择方法上,我们经常采用 F 检验决定选用混合模型 还是固定效应模型,然后用 Hausman 检验确定应该建立随机效应模型还是固定效 应模型。
检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归:在回归的时候,权数可以选择按截面加权(cross-section weights )的方式, 对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差现 象。估计方法采用 PCSE (Panel Corrected Standard Errors ,面板校正标准误)方 法。 Beck 和 Katz(1995)引入的 PCSE 估计方法是面板数据模型估计方法的一个创新, 可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本 量不够大时尤为有用。
转载请注明出处范文大全网 » 面板数据回归分析步骤