范文一:一种多对象时间序列数据存储设计
龙源期刊网 http://www.qikan.com.cn
一种多对象时间序列数据存储设计
作者:张青
来源:《计算机光盘软件与应用》 2013年第 15期
摘 要:本文讨论了在现有的数据存储和索引技术的基础上,结合固定周期产生状态数据 设备的检测特点定义了一种存储结构和索引结构,以获得更高的空间利用率和查询效率。首先 深入分析状态数据所具有的时间和设备二维性并定义了相应的二维存储结构,分别针对每一维 建立了索引,然后分析了基于此结构的存储和查询方法。
关键词:索引;二维存储;存储结构
中图分类号:TP274.2
随着计算机技术在我国的全面发展与运用,在社会、经济、政治等诸多领域快速发展,在 日常应用中经常遇到一类设备状态监控的问题。每个设备按照时间周期返回状态数据,系统需 要记录系统中设备运行状况,在设备出现问题时可以通过历史记录进行问题分析和问题定位的 情况。当前的应用发展趋势表明,被监测设备的数目正在迅速增长,同时随着技术的进步以及 应用的需求,数据回传的周期也越来越短。对这类应用数据存储要求也越来越高。数据特点如 下:多个设备数据相互独立,设备本身变化不频繁。但偶尔设备会出现问题,修理后重新启 动,状态数据会中断。
(1)设备状态数据采集时间间隔固定。
(2)单设备按时间顺序产生数据,不同设备的数据产生也基本有序。
(3)数据持续增加,在一个时间段内增加频率有规律可循,数据量大。
(4)主要操作为存储和查询。
1 数据文件存储和查询
对于要长期保存的数据,我们需要用数据文件保存,为了提高查询的效率我们必然要针对 数据文件建立索引。索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快 速访问数据库表中的特定值。不同的索引设计对数据的插入、查询、删除、修改等操作效率将 产生巨大影响。高效的索引文件,应该根据主文件数据结构特点进行设计。
对数据文件建立索引首先想到的是 B (B+, B-)树。 B 树是一种最常见的组织索引的方 式。在 B 树中,首先设定内部(非叶子)节点包含子节点数量范围。当一个节点中数据插入或 移除数据时,如果节点删除或插入数据后节点保存数据数量超出规定的范围,为了维持保存数 据的数量在设定范围内,内部节点可能会被连结或者分离。每个节点存储多个数据,从而使查
范文二:多变量时间序列
二维变量模型分析
摘要:美国是发达国家,其经济发展迅速,带动全球经济发展,因此我们来研究一下美国的经济发展,下列用美国1970年第一季度至1991年第四季度美国宏观经济数据 来进行研究。
关键词:PDI,PCE ,VAR模型,脉冲影响函数,方差分析 ,滞后期。
数据如下:
obs PCE PDI
1970Q1 1800.5 1990.6
1970Q2 1807.5 2020.1
1970Q3 1824.7 2045.3
1970Q4 1821.2 2045.2
1971Q1 1849.9 2073.9
1971Q2 1863.5 2098
1971Q3 1876.9 2606.6
1971Q4 1904.6 2121.1
1972Q1 1929.3 2129.7
1972Q2 1963.3 2149.1
1972Q3 1989.1 2193.9
1972Q4 2032.1 2272 1973Q1 2063.9 2300.7 1973Q2 2062 2315.2 1973Q3 2073.7 2337.9 1973Q4 2067.4 2382.7 1974Q1 2050.8 2334.7 1974Q2 2059 2304.5 1974Q3 2065.5 2315 1974Q4 2039.9 2313.7 1975Q1 2051.8 2282.5 1975Q2 2086.9 2390.3 1975Q3 2114.4 2354.4 1975Q4 2137 2389.4 1976Q1 2179.3 2424.5 1976Q2 2194.7 2434.9 1976Q3 2213 2444.7 1976Q4 2242 2459.5 1977Q1 2271.3 2463 1977Q2 2280.8 2490.3 1977Q3 2302.6 2541 1977Q4 2331.6 2556.2 1978Q1 2347.1 2587.3
1978Q2 2394 2631.9 1978Q3 2404.5 2653.2 1978Q4 2421.6 2680.9 1979Q1 2437.9 2699.2 1979Q2 2435.4 2697.6 1979Q3 2454.7 2715.3 1979Q4 2465.4 2728.1 1980Q1 2464.6 2742.9 1980Q2 2414.2 2692 1980Q3 2440.3 2722.5 1980Q4 2469.2 2777 1981Q1 2475.5 2783.7 1981Q2 2476.1 2776.7 1981Q3 2487.4 2814.1 1981Q4 2468.6 2808.8 1982Q1 2484 2795 1982Q2 2488.9 2824.8 1982Q3 2502.5 2829 1982Q4 2539.3 2832.6 1983Q1 2556.5 2843.6 1983Q2 2604 2867 1983Q3 2639 2903
1983Q4 2678.2 2960.6 1984Q1 2703.8 3033.2 1984Q2 2741.1 3065.9 1984Q3 2754.6 3102.7 1984Q4 2784.8 3118.5 1985Q1 2824.9 3123.6 1985Q2 2849.7 3189.6 1985Q3 2893.3 3156.5 1985Q4 2895.3 3178.7 1986Q1 2922.4 3227.5 1986Q2 2947.6 3281.4 1986Q3 2993.7 3272.6 1986Q4 3012.5 3266.2 1987Q1 3011.5 3295.2 1987Q2 3046.8 3241.7 1987Q3 3075.8 3285.7 1987Q4 3074.6 3335.8 1988Q1 3128.2 3380.1 1988Q2 3147.8 3386.3 1988Q3 3170.6 3407.5 1988Q4 3202.9 3443.1 1989Q1 3200.9 3473.9
1989Q2 3208.6 3450.9
1989Q3 3241.1 3466.9
1989Q4 3241.6 3493.0
1990Q1 3258.8 3531.4
1990Q2 3258.6 3545.3
1990Q3 3281.2 3547.0
1990Q4 3251.8 3529.5
1991Q1 3241.1 3514.8
1991Q2 3252.4 3537.4
1991Q3 3271.2 3539.9
1991Q4 3271.1 3547.5
其中,PDI代表个人可支配收入,PDE代表个人消费支出,所有数据
都以1987的10亿为单位,共有88个季度观测值。 现在现对数据进行因果关系分析,分析不同滞后期,选择合适的滞后
期,进行模型的建立。
过程如下:
VAR Lag Order Selection Criteria Endogenous variables: PCE PDI Exogenous variables: C Date: 07/07/11 Time: 00:23 Sample: 1970Q1 1991Q4 Included observations: 82
Lag LogL LR FPE AIC SC HQ
-1070.6584553178
0 3 NA 7.89e+08 26.16240 26.22110 26.18597
-810.09236519229
1 6 502.0664* 1512090.* 19.90469* 20.08079* 19.97539*
2 -808.26777405515 3.426671 1594865. 19.95775 20.25125 20.07559
-807.08373630697
3 8 2.165923 1709158. 20.02643 20.43734 20.19140
-803.73595169574
4 6 5.960690 1738202. 20.04234 20.57064 20.25445
-801.39692389590
5 9 4.050512 1812743. 20.08285 20.72856 20.34209
-799.80068775137
6 1 2.686349 1926317. 20.14148 20.90459 20.44786
* indicates lag order selected by the criterion
LR: sequential modified LR test statistic (each test at 5% level)
FPE: Final prediction error
AIC: Akaike information criterion
SC: Schwarz information criterion
HQ: Hannan-Quinn information criterion
从上面的所有图可以看出和赤池信息可以看出推断,二阶滞后的情
况看,PDI和PCE互为因果关系,既相互影响。
由此可以建立VAR模型,如图:
Vector Autoregression Estimates
Date: 07/07/11 Time: 00:34
Sample (adjusted): 1970Q3 1991Q4
Included observations: 86 after adjustments
Standard errors in ( ) & t-statistics in [ ]
PCE PDI
PCE(-1) 1.167906 0.887015
(0.11061) (0.38013)
[ 10.5586] [ 2.33345]
PCE(-2) -0.188895 -0.106254
(0.11286) (0.38785)
[-1.67372] [-0.27396]
PDI(-1) 0.022810 0.160353
(0.03249) (0.11166)
[ 0.70201] [ 1.43605]
PDI(-2) -0.003556 0.061390
(0.03198) (0.10990)
[-0.11121] [ 0.55860]
C 12.93416 220.5645
(15.4059) (52.9441)
[ 0.83956] [ 4.16599]
R-squared 0.998431 0.981989
Adj. R-squared 0.998353 0.981099
Sum sq. resids 27553.30 325411.8
S.E. equation 18.44354 63.38319
F-statistic 12884.75 1104.052
Log likelihood -370.1185 -476.2842
Akaike AIC 8.723686 11.19266
Schwarz SC 8.866381 11.33535
Mean dependent 2554.086 2824.489
S.D. dependent 454.5105 461.0374
Determinant resid covariance (dof adj.) 1338765.
Determinant resid covariance 1187620.
Log likelihood -845.5183
Akaike information criterion 19.89577
Schwarz criterion 20.18116
有图可以看出建立的方程可为:
PCE=1.167906* PCE(-1) -0.188895
*PCE(-2)+ 0.022810* PDI(-1) -0.003556
* PDI(-2)+ 12.93416 PDI =0.887015* PCE(-1) -0.106254
*PCE(-2)+ 0.160353* PDI(-1) + 0.061390
* PDI(-2)+ 220.5645
现在对方程进行稳定性分析——利用AR根图
AR检验的是方程的平稳性,即利用AR根图得到单位圆曲线以及
VAR模型的全部特征根得到数值,若其倒数的值都在单位圆内表明 VAR稳定。
如图:
由图可以看出方程式稳定的。
现在对方程进行脉冲响应函数。本题中VAR模型包括两个变量,则有 四个脉冲响应函数,现在将其合成图列出进行研究。
可以看出此序列对来自PDI的影响比较小,来自PCE的影响比较大。
现在进行方差分解分析,得到PDI和PCE方差分解图,图中横轴表示
滞后期数,纵轴表示贡献率(百分数)。
Varianc
e
Decomp
osition of
PCE:
Period S.E. PCE PDI
1 18.4435409498434 100 0
2 28.5504281196028 99.748795131109 0.251204868891047
3 36.2588580727132 99.6301905729288 0.369809427071256
4 42.6228569024795 99.5526899815634 0.447310018436638
5 48.1379382212088 99.5034493658039 0.496550634196111
6 53.0643145087189 99.4700679553112 0.529932044688798
7 57.5530165513837 99.446352801 0.553647198999967
8 61.699802522865 99.4287458925571 0.571254107442863 9 65.5697038115492 99.4151972967807 0.584802703219291 10 69.2092687035417 99.4044612857046 0.59553871429539 11 72.6531864225626 99.3957485395521 0.604251460447892 12 75.9281395302092 99.3885376788805 0.611462321119465 13 79.0551805921467 99.3824716253592 0.617528374640757 14 82.0512708461567 99.3772979650537 0.622702034946324 15 84.9303163891218 99.3728333397493 0.627166660250708 16 87.7038891963933 99.3689413816925 0.631058618307488 17 90.3817428733641 99.3655185792622 0.634481420737769 18 92.9721903903549 99.362484947771 0.637515052228962 19 95.4823864494639 99.3597777058954 0.640222294104619 20 97.9185423727247 99.3573468868961 0.642653113103911 21 100.286092242199 99.3551522279329 0.644847772067084 22 102.589823169706 99.3531609234748 0.64683907652523 23 104.833978735573 99.3513459752058 0.648654024794203 24 107.022342060252 99.3496849614992 0.650315038500807 25 109.158303208629 99.3481591070599 0.651840892940076 26 111.244914396121 99.3467525706498 0.653247429350227 27 113.284935592552 99.3454518934975 0.654548106502467 28 115.280872490858 99.3442455676358 0.65575443236426 29 117.235008348327 99.3431236948076 0.656876305192357 30 119.149430868212 99.3420777145231 0.657922285476864
Varianc
e
Decomp
osition of
PDI:
Period S.E. PCE PDI
1 63.3831925081518 2.03580323290484 97.9641967670952 2 66.6019341379964 8.99447005034007 91.0055299496599 3 70.0809888786311 16.8826180755513 83.1173819244487 4 73.479347576791 24.2226374443969 75.7773625556031 5 76.8014232192528 30.5448364096021 69.4551635903979 6 80.0016482385648 35.9280330472967 64.0719669527033 7 83.0762275317482 40.5300799369272 59.4699200630728 8 86.0323429085432 44.4993713371392 55.5006286628608 9 88.8798675795275 47.9549361441086 52.0450638558914 10 91.6283265098377 50.9895443231558 49.0104556768441
11 94.2862238033324 53.67541714964 46.32458285036 12 96.8609920022998 56.0693068836111 43.9306931163889 13 99.359113839404 58.2163316740551 41.7836683259449 14 101.786265526533 60.1527833787984 39.8472166212016 15 104.147445106807 61.9081766558614 38.0918233441386 16 106.447079267485 63.5067578113337 36.4932421886663 17 108.689110595609 64.9686292960471 35.0313707039529 18 110.877068767254 66.3105984584278 33.6894015415722 19 113.014128919855 67.5468260417525 32.4531739582474 20 115.103159847873 68.689327372555 31.3106726274451 21 117.146764087302 69.7483638267882 30.2516361732118 22 119.147311490971 70.73275160291 29.26724839709 23 121.106967540163 71.6501074855126 28.3498925144874 24 123.027717367301 72.5070461062143 27.4929538937857 25 124.911386258423 73.309339513571 26.690660486429 26 126.759657246582 74.0620471945845 25.9379528054155 27 128.57408628572 74.76962274024 25.23037725976 28 130.35611540005 75.4360019075002 24.5639980924998 29 132.10708412994 76.0646757562447 23.9353242437553 30 133.828239536758 76.6587517312249 23.3412482687751
Cholesk
y
Ordering
: PCE
PDI
表包括四列,第一列预测期,第二列SE为变量PCE的各期预测标 准误差。其他各列分别代表以PDI和PCE为变量的方程信息对各期 预测误差的贡献度,每行加起来是100.由于PCE是模型出现的第一 个内生变量,根据算法要求,的一部预测误差全部来自该方程的信息。 有方差分解图可以看出,PCE来自本身信息的影响最大,从第一起 到最后一期,几乎达到100%。
现在对模型进行预测。包括动态预测和静态预测,现在对其进行静态 预测 。
如图
静态预测比动态预测效果好,因为静态预测是使用样本实际观测值进
行预测,所以用静态预测。
范文三:基于多参数状态时间序列的交通状态预测方法
基于多参数状态时间序列的交通状态预测方法
*
张心哲 关 伟
(北京交通大学城市复杂交通系统理论与技术教育部重点实验室 北京 100044)
摘 要 利用多个参数描述交通状态时 , 交通流数据表现 为多维 空间数 据。提出了 将属于 每个状 态 的多维空间数据转换为一维时间序列的方法 , 对于此状态时间序列采用 BP 神经网络进行了下 1个时 段的交通状态预测。实验结果表明 , 多参数状 态时间序列比 单个参数 时间序 列能更 准确地 描述交 通 流状态变化过程 , 且算法简单 , 具有较强的预测实时性。 关键词 状态时间序列 ; 交通状态预 测 ; 神经网络 ; 交通流参数
中图分类号 :U 491. 1 文献标志码 :A DOI:10. 3963/j. ISSN 1674 4861. 2009. 06. 001
城市快速路交通状态的动态估计和预测是智 能交通系统的重要构成部分。可靠的交通状态估
计及预测信息是交通信息服务、 交通控制与诱导 的重要基础 , 可用于动态路径诱导、 事件检测、 快 速路匝道控制和可变信息标志 (variable message sign, VM S) 系统信息发布等方面。
至今 , 对动态交通流预测的研究 [1 2]大多是对 单个交通流参数时间序列 (即流量、 速度、 密度、 行 程时间等 ) 的短时预测 [3 5]
。但是仅根据某 1个交 通流参数来描述交通流状态不能全面地反映实际 情况 , 应该综合考虑交通流的各种参数以确定和 估计交通流状态。有些文献利用多个交通流参数 (如交通流量、 平均速度、 占有率或密度等 ) 对交通 状态分类及评价标准进行了研究 [6 11]。如果某 1个变量可以反映出基于多个交通流参数的交通状 态特征 , 则可以将基于多个参数的交通状态变化 过程表述为一维时间序列形式 , 以便于 预测下 1个时段的交通状态。
本文提出 1种将多参数交通状态转换为一维 时间序列的方法 , 利用此时间序列对短时交通状 态进行预测研究。
1 交通状态时间序列的表述方法
通常交通状态用交通服务水平来描述 , 可以 建立起交通状态分级和整数之间的对应关系 , 如 结合 VM S 描述交通流状态的方 式 , 将交通流状
态划分为 :1-畅通流 (绿 ) 、 2-缓慢流 (黄 ) 、 3-拥 挤 (红 ) 等。这样既保留了交通流状况之间的顺序 关系 , 也便于模型处理。由交通流参数的特征 , 利 用多个参数评价交通状态比利用单个参数可以更 全面地反映交通流的实际情况。利用多个参数评 价交通状态时 , 本文把此评价状态称为多参数状 态。多参数状态中每个状态在多维空间上占有一 定区 域 , 其 区 域 的 几 何中 心 表 示 为 O i (i =1, 2, , c) 。如果采用聚类分析进行交通状态分类 , 每个状态类的聚类中心就是 O i 。某 1个时刻的 检测数据属于某 1个状态。一般 , 在时刻 t 的样 本数据标记为 :
x =x (t) ={x 1(t) , x 2(t) , , X m (t) }式中 :m 为交通 参数数目。例 如 , 利用交 通流量 q(t) 、 平均速度 v (t) 、 密 度 p (t) 的 时候 , x 1(t) 、 x 2(t) 、 x 3(t) 分别为 q (t) 、 v(t) 、 p (t) 。把 m 维空 间上的点 x (t) 基于状态分类信息转换为维时间 序列称为多参数状态 -时间序列转换 , 通过此转 换得到的时间序列称为状态时间序列。为了把 x (t) 转换为状态时间序列 , 进行对状态时间序列转 换中心的定义。
定义 :
对任意状态 k , 满足 : O k - O k 2:=min( O k-1-O k 2,
O k -O k +1 2)
(1)
的 O k 称为对状态 k 的状态时间序列转换中心。
收稿日期 :2009 05 22 修回日期 :2009 09 19
*国家自然科学基金项目 (批准号 :60874078, 60834001) 、 国家重点 基础研究发展计 划项目 (批 准号 :2006CB70557) 、 高等 学校博士 学
科点专项科研基金项目 (批准号 :20070004020) 资助
作者简介 :张心哲 (1971) , 博士研究生 (朝鲜留学生 ) . 研究方向 :系统工程 , 智能交通系统 . E mail:Jan g_XZ@yah oo. com. cn
1
基于多参数状态时间序列的交通状态预测方法 张心哲 关 伟
状态时间序列转换中心 O k 是与 k 状态中心 O k 最 近的 邻接 状态中 心。 O k 也 是某 1个状 态的 几何中心 , 此状态标记为 k , 即 k =k +1或者 k =k -1。如果把 x (t) 所属的状态中心 O k 作为它 的转换中心 O k (既 k =k) , 则可以表示在其状态 区域内 x 偏离中心的程度 , 但是不能描述 x 对邻 接状态的接近程度。所以把从 x 所 属的状态中 心最近的邻接状态中心作为状态时间序列转换中 心 , 这时 , 必须满足 k k 。若 2个状态中心 (O k +1或 O k -1) 都满足式 (1) , 则其中 1个作为 O k , 即任 意 x 的状态时间序列转换中心 O k 是惟一的。如 果样本数据 x (t) 属于状态 k, x 和对应的 O k 之间 的距离可以用式 (2) 计算。
d(x , O k ) = x - O k 2(2) 由式 (1) 、 (2) 可知 , d (x , O k ) ) 越小 , x 就越接 近邻接状态 ; d (x , O k ) 越大 , x 就越远离 邻接状 态。但只依赖 d (x , O k ) 不能把 x (t) 转换为时间 序列。因为 d(x , O k ) 仅 反映 x 和邻接状态的接 近程 度 , 没有反映每个状态 对应的整数的大小。 其实 , 每个状态对应着某 1个整数 , 样本数据 x 越 接近大整数的状态时 , 使得对应的时间序列取值 越大。这样 , 可以同时考虑 x 所属的状态和与邻 接状态的关系 , 且 m 维空间上的数据 x 转换为一 维时间序列 , 这就是交通状态时间序列生成过程 (见图 1) 。为此 , 假定有变换 Y, 被变换 Y 转换的 时间序列记为 y (t) , 变换公式如下 :
y (t) =Y(x (t) ) = (k -
1) +m in
x k
d (x , O k )
1
d(x , O k )
, k =k +1
(k -1) +
1
max
x k
d (x , O k )
d(x , O k ) , k =k -1
(3)
图 1 状态时间序列 生成原理图
式 (3) 中 , k 、 k 分别为 x 和 O k 所属的状态分 级整数 , 式中第 1个部分反映样本数据所属的状 态 , 第 2个部分表示在状态 k 内每个样本的取值。 由式 (3) 可以引出如下的结论。
定理 :
(状态时间序列 y (t) 的性质 )
1) 状态时间 序列 y (t) 具有 (0, c]的取值范 围 , 即 y (t) (0, c]
2) 对 x , x k, 若 k >k , d(x , O k ) 证明 : 1) 若式 (3) 中第 2个部分标记为 , 则 y (t) =(k -1) + 。 d(x , O k ) >0, 因此 >0。若 k = k +1, =min x k d (x , O k ) /d(x , O k ) d(x , O k ) /d(x , O k ) =1 若 k =k -1, = 1 m ax x k d (x , O k ) d(x , O k ) 1 d(x , O k ) d(x , O k ) =1 由此可知 0< 1。="" k="" [1,="" c],="" 所以="" y="" (t)="" (0,=""> 2) 由式 (3) 亦可证明 (本文省略 , 证明完 ) 。 性质 2意味着 x 越靠近比状态 k 更大的等级 状态 , 对应的状态时间序列 取值越大 , 而且 x 越 靠近比状态 k 更小的等级状态 , 对应的状态时间 序列取值越小。 例如 , y (10) =1. 35意味着在第 10个时刻交 通状态处于状态 2。通过该算法得到的状态时间 序列不仅反映某 1个样本数据属于哪 1个状态 , 而且同时描述同一状态中不同样本的分布情况。 也就是说 , 样本数据的空间状态分布可以转换为 一维时间状态分布。利用此状态时间序列可以预 测到下 1个时段的交通状态。 2 交通状态预测模式 短时交通流预测模型有多种 , 如历史平均模 2交通信息与安全 2009年第 6期 第 27卷 总 152期 模型、 神经网络模型和组合模型等。但这些预测 模型都是对单个交通 流参数时间序 列的预测模 型。利用状态时间序列可以直接采用单个变量时 间序列预测方法预测下 1个时段的交通状态 , 可 以保证交通状态判断的合理性、 预测的实时性和 简单性。利用神经网络模型对交通流进行预测是 1种比较普遍的方法。其中 BP 神经网络是目前 应用最为广泛和成功的神经网络之一。在人工神 经网络的应用中 , 绝大部分的神经网络模型采用 了 BP 网络及其变化形式。本文利用 BP 神经网 络方法进行路段短时交通状态预测 , 选择路段的 1周的交通状态数据作为训练样本。基于状态时 间序列转换的交通状态预测模式如图 2 所示。 图 2 交通状态预测 的基本模式 3 实例应用 数据来源于北京二环快速路 , 数据采集时间 为 2006年 3月 3日 ~2006年 3月 9日 , 二环上共 有 67个检测器 , 将内环断面的 1周检测数据作为 样本数据。本文利用交通流的 3个基本参数 , 即 交通流量、 平均速度、 密度 , 以 3个状态分类为实 例进行交通状态预测。即 x ={q(t) , v(t) , p (t) }, C =3。根据整个路段 1周检测数据 , 通过聚类分 析构造最小距离分类器 , 即求得每个状态类的中 心 , 此中心作为状态评价标准。 得到的 3个状态 类的中心如下 : O =[o 1, o 2, o 3]= 554. 33 1391. 951375. 46. 16 36. 67 12. 48 7. 42 39. 06 106. (4) 该中心矩阵中第 1行为交通流量 , v eh/h; 第 2行为平均速度 , km /h; 第 3行为密度 , veh/km 。 以路段 02055为例进行具体分析。根据上述的分 类标准 , 每个时刻的检测数据转换为状态时间序 列 , 其结果如图 3、 4所示。 信息 (即状态 k) , 图 4显示转换后的状态时间序 列 (即 y (t) ) 。从图 3、 4中可以看出 , 图 3仅反映 随时间的宏观状态变化 , 但图 4不仅反映状态变 化的具体程度 , 也可以采用普通时间序列方法来 进行处理。 图 3 转换前的 时间 状态变化 图 4 转换后的状态时间序列 3. 1 单个参数时间序列和状态时间序列的比较 一般来说 , 因为速度参数直观地反映交通流 状态 , 所以在实际应用中把速度参数作为交通流 状态判断的基本指标。这里对基于速度参数时间 序列的状态评估和基于状态时间序列的状态评估 进行比较试验。速度参数时间序列和基于速度参 数的状态变化如图 5、 6所示。基于速度参数的状 态评价标准分别为 :状态 1-40以上、 状态 2-(20, 40]、 状态 3-(0, 20], 单位为 km /h 。 图 5 速度参数时间序列 图 6 基于速度参数的时间 状态变化 由图 3、 6可以看出 , 基于速度参数的状态评 , 3 基于多参数状态时间序列的交通状态预测方法 张心哲 关 伟 状态 (即缓慢流状态 ) , 因为在该时段内速度参数 取 (20, 40]范围的数值。但是根据状态时间序列 , 在该时间内交通流 处于第 1个状态 , 即畅通流。 图 5中 , 在时段 06:40~06:50内交通流处于缓慢 流状态 , 而图 6中在该时段内交通流处于畅通流 状态。考虑此时段内各参数取值 , 取流量参数值 为 864veh/h, 速度参数值为 38km/h, 密度参数值 为 21veh/km 。然速度参数取值属于缓慢流状态 区间 , 但是考虑流量和密度参数 , 在该时段内交通 流应该处于 畅通流状态。另外 , 在 图 5中 , 时段 10:00~10:10处于缓慢流状态 , 因为在这个时段 内速度参数取值为 21km/h 。但是流量和密度参 数取值分别为 1785veh/h 、 81veh/km , 这个状态 应该属于拥挤状态。对其他时段也可以进行同样 评价。由此可知 , 多参数状态估计方法比单个参 数状 态估计方法更加合理 , 比较符合实际情况。 速度时间序列只反映速度参数的变化过程 , 而状 态时间序列可以反映基于多个参数的状态变化过 程。 3. 2 状态预测及结果分析 本文对状态时间序列采用 BP 神经网络进行 预测。在建立 BP 神经网络模型时 , 输入层节点 数设为 6, 输出层节点数设为 l, 中间层节点数设 为 13, 预测时间间隔为 10m in 。用训练好的神经 网络 , 对实例对象进行预测 , 图 7显示利用状态时 间序列的预测结果。 本文需要的预测结果是下 1个时段的交通流 状态类型 , 结果应该是整数。但是图 7中的实际 值和预测值都不是整数。所以根据式 (3) , 从实际 值 y 或预测值 y ^取出反映状态的整数 k 或 ^k 。通 过式 (5) 可以求得 k 和 ^k 。 k(t) =fix (y (t) ) +1 ^k (t) =fix (y ^(t) ) +1 (5) 式中 :fix ( ) 为取整数部分的函数。用图 3的形 式可以画出 k(t) 和 ^k (t) 。状态预测误差关系到 误差发生数目和预测误差大小 , 误差评价指标定 义如式 (6) 。 E = N N t =1 |k(t) -^k (t) |(6) 对转换前 (见图 3) 和转换后 (见图 4) 的曲线 进行预测 , 其预测误差结果如图 8所示 (纵坐标指 预测及实际状态号之间的差 ) 。从图 8可知 , 转换 后状态时间序列的预测误差发生数目比转换前要 (, : 转换前 , E 前 =9/(6 24) =0. 0625 转换后 , E 后 =5/(6 24) =0. 0347 预测误差按照路段或者预测时段可能会有差 异 , 但是 , 多次实例试验表明对状态时间序列的预 测误差比转换前要小 , 可以用于交通诱导系统。 图 7 预测结果 图 8 状态预测误差 由上述结果可知 , 1个状态时间序列可以反 映影响交通状态分析的多个参数的特征 , 此状态 时间序列可以用于交通流状态短时预测。 4 结束语 交通流状态判别及预测在城市交通管理和诱 导中起着十分重要的作用。只根据单个参数进行 交通状态分类不能全面地反映出交通流的实际情 况。 本文综合考虑多个参数来确定并预测交通状 态。利用多个参数描述交通状态时 , 交通流数据 表述为多维空间数据。本文提出了将多维数据转 换为一维时间序列的方法 , 对于此状态时间序列 采用 BP 神经网络进行了短时交通状态预测。 试验结果表明多参数状态时间序列比单个参 数时间序列能更准确 描述交通流状 态的实际情 况。利用多参数状态 -时间序列转换算法 , 样本 数据的多维空间分布可以转换为时间分布。一般 利用单个变量时间序列预测技术 , 可以进行反映 多个参数的状态预测。基于多参数状态 -时间序 列转换的交通状态预测方法可以用于交通诱导系 4交通信息与安全 2009年第 6期 第 27卷 总 152期 参考文献 [1] 刘 静 , 关 伟 . 交通流预测方法综述 [J]. 公路交 通 科技 , 2004, 21(3) :82 85 [2] 王 进 , 史其信 . 短时交通流预测模型综述 [J]. 智 能 交通 , 2005(6) :92 98 [3] 徐今强 , 张裕清 . 基于 BP 神 经网络的 城市交通流 预 测研究 [J]. 现代电子技术 , 2006(23) :104 106[4] 王 军 , 许宏科 , 蔡晓峰 , 等 . 基 于 BP 神经网络的 高 速公路 动态 交 通 流 预测 [J].公 路 交通 技 术 , 2007(1) :150 152, 163 [5] Chr obok R, Kaumann O , W ahle J, et al. Different methods of tr affic for ecast based o n real data [J].European Jour nal of Operat ional Resea rch, 2004, 155(3) :558 568 [6] W ang Yaqin, Chen Y ue . Dy nam ic tr affic pr ediction based on tr aff ic Flo w mining [C]. P roceeding s of the 6th W or ld Congr ess on Intellig ent Contro l and Au tomation, Da lian:Dalian U nivesity o f T echnolog y, 2006, [7] 袁月明 , 关 伟 , 吴建 平 . 基于视频 检测技 术的城 市 快速交通状态分析研究 [J]. 交通与计算 机 , 2008, 26(4) :1 3 [8] 陈 德望 . 基 于 模 糊聚 类 的快 速 路交 通 流 状况 分 类 [J]. 交通运输系统工程与信息 , 2005, 5(1) :62 67[9] 孙 亚 , 钱洪波 , 叶 亮 . 数据挖掘 算法在 交通状 态 量化及 识别 的应 用 [J]. 计 算机 应用 , 2008, 28(3) :738 741 [10] 姜桂艳 , 郭海锋 , 孟志强 , 等 . 基于 实时信 息的城 市 道路交通状态评价指 标体系研 究 [J].交通 与计 算 机 , 2007, 25(5) :21 24 [11] 吴 兵 , 周闻 钧 , 张 维东 . 利 用数 据挖 掘技 术建 立 城市区域交通流状态 分析预测 模型 [J]. 公 路交 通 技术 , 2003, 2(1) :61 64 Traffic Prediction Method Based on Multi parameter Status Time Series JANG SimChol GUAN Wei (MOE K ey L abor ator y f or Ur ban Tr ansp or tation Comp lex Sy stem T heory and T echnology , Beij ing J iaotong Univ er sity , Beij ing 100044, China) Abstract:Predictio n of the traffic status plays a v ery impo rtant r ole in management and g uidance of urban traffic. In g ener al, traff ic status cannot be fully described by a sing le parameter. T herefor e, the tr affic status should be described throug h a set o f par ameters, such as flow , speed and density. In the pr oposed method, the mult i dimensio na l traffic data are fir st transfor med into one dimensional time ser ies, and then the tr affic status for the nex t time interv al is pr edicted by using BP neur al netw or k. T he ex per imental results sho w that the multi parameter status t ime ser ies descr ibes the chang es of tr affic st atus mo re accur ately than one par ameter t ime series. T he alg or ithm is not o nly simple but also pr actical for pr edict ing tr affic st atus in r ea l time and t hus it can be used in future tr af fic guidance system. Key words:status time series; traff ic stat us prediction; neural netw o rk; tr affic flo w par ameter 5 基于多参数状态时间序列的交通状态预测方法 张心哲 关 伟 第! " 卷第#期 $%&’! " (%’# 控制与决策 ! " " 6年#月 89:’!" " 6) *+, -*. /+0123454*+7777777777777777777777777777777777777777777777777777777777777777777 文章编号;@" " @<" C ! " A ! " " 6E " #<" ! C " <" D 多变量时间序列相空间重构中参数的确定 岳毅宏G 韩文秀G 程国平 天津大学管理学院G 天津#A " " " B ! E 摘 要; 介绍了多变量时间序列相空间重构理论’提出一种新的基于平均预测误差最小化的重构参数确定方法G 阐 述了该方法的算法过程及一些重要特点’此方法考虑了所有重构参数对平均预测误差的影响G 能够同时确定重构系统相空间所需的恰当嵌入维数及时间延迟’最后将该方法应用于股票市场非线性动力系统的相空间重构G 通过比较和分析验证了其优越性’ 关键词; 多变量时间序列? 相空间重构? 嵌入维数? 时间延迟? 平均预测误差中图分类号; I @#J 文献标识码; K Y L M N M O P Q R S N Q T RT U V S O S P M N M O W Q RN X M V X S W M W V S Z M O M Z T R W N O [Z N Q T RT U P [\N Q ]S O Q S N M N Q P M W M O Q M W A G I G I " " " B ! G y ’y ; |u }|s ; J <’k k="" #$w="" n="" o="" s="" z="" n="" r="" 9w="" m="" w="" z="" 9q="" m="" :m="" q="" %k="" w="" o="" :!="" q="" o="" s="" %ko="" r="" m="" %:x="" %%n="" !="" &o="" s="" v="" 9:s="" 9o="" m="" o="" s="" n="" m="" w="" m="" :s="" m="" w="" s="" w="" s="" k="" o="" :%{!="" q="" m="" {%v="" m="" &n="" m="" o="" r="" %{%%{m="" o="" m="" :n="" s="" k="" s="" k="" l="" g="" :m="" q="" %k="" w="" o="" :!="" q="" o="" s="" %kz="" 9:9n="" m="" o="" m="" :w="" &9w="" m="" {%ko="" r="" mn="" s="" k="" s="" n="" s="" ’9o="" s="" %k%%9v="" m="" :9l="" m="" %%:m="" q="" 9w="" o="" s="" k="" lm="" ::%:swz="" :%z="" %w="" m="" {9k="" {so="" w9&l="" %:s="" o="" r="" n="" ’i="" !="" :m="" 9k="" {w%n="" m="" s="" n="" z="" %:o="" 9k="" o="" q="" r="" 9:9q="" o="" m="" :s="" w="" o="" s="" q="" w="" 9:m="" m="" (z="" &s="" q="" 9o="" m="" {r="" m="" n="" m="" o="" r="" %{q%k="" w="" s="" {m="" :w="" o="" r="" m="" m="" %%m="" q="" o="" w="" %%9&&:m="" q="" %k="" w="" o="" :!="" q="" o="" s="" %k="" z="" :%q="" m="" {’)="" z="" 9:9n="" m="" o="" m="" :w="" %k9v="" m="" :9l="" m="" %%:m="" q="" 9w="" o="" s="" k="" l="" m="" ::%:o="" q="" 9kw="" s="" n="" !="" &o="" 9k="" m="" %!="" w="" &x="" {m="" o="" m="" :n="" s="" k="" m="" o="" r="" m="" q="" %::m="" q="" o="" m="" n="" &m="" {{s="" k="" l="" {s="" n="" m="" k="" w="" s="" %k="" w="" 9k="" {o="" s="" n="" m="">’k><’i>’i><{m &9x="" w="" k="" m="" m="" {m="" {%%:&m="" o="" o="" m="" ::m="" q="" %k="" w="" o="" :!="" q="" o="" s="" k="" l="" w="" x="" w="" o="" m="" n="" 9o="" s="" q="" z="" r="" 9w="" m="" w="" z="" 9q="" m="" r="" m="" n="" m="" o="" r="" %{s="" w="" 9z="" z="" &s="" m="" {o="" %o="" r="" m="" z="" r="" 9w="" m="" w="" z="" 9q="" m="" ’i="" g="" s="" :m="" q="" %k="" w="" o="" :!="" q="" o="" s="" %k%%k="" %k="" &s="" k="" m="" 9:{x="" k="" 9n="" s="" q="" 9&w="" x="" w="" o="" m="" n="" %%w="" o="" %q="" ~n9:~m="" o="" r="" :%!="" l="" rq="" %n="" z="" 9:s="" k="" l9k="" {9k="" 9&x="" ’s="" k="" l="" o="" w="" w="" !="" z="" m="" :s="" %:s="" o="" xs="" w="" ’v="" m="" :s="" %s="" m="">{m> ; n ! ? z <? m ? o ? 9*M +, T O -W &o s v 9:s 9o m o s n m w m :s m w r 9w m w z 9q m :m q %k w o :! q o s %k n &m {{s k l {s n m k w s %k s n m {m &9x v m :9l m %%:m q 9w o s k lm ::%: . 引 言 确的’对于很多系统A 如经济系统E 其可测输出序列G 往往是多维的G 在这种情况下G 可考虑利用目标系统的多个输出变量序列来重建系统的动力学特性’ 文献/对多变量时间序列的相空间重构进#G D 0并论证了其优越性’其中文献行理论和应用研究G 60 提出一种基于4零级近似5模型/的嵌入维数确/#0 定方法G 其基本思想是恰当的嵌入维数能使平均预 嵌入理论的提出为时间序列的分析奠定了坚实 @0 的理论基础/从理论上讲G 只要时间延迟与嵌入维’ 数选择恰当G 单变量时间序列便足以重建原始系统的动力学特性’但实践中却存在意外的情形G 比如方程G 对2轴输出数据进行采样而形成的1%:m k ’ 时间序列就不能重构1系统的动力学特性’这%:m k ’ /! 0 是因为该系统g 轴与3轴之间的对称关系没有反映到2轴数据中’因此G 认为任何给定的单维时间序列就足以重建原始系统动力学特性的观点并不总是正 收稿日期;! " " #<"=? 修回日期;! " " #<><@#’基金项目; 国家自然科学基金项目a="" b="" c="" c="" b="" "="" "="" d="" #e="">@#’基金项目;> 测误差值达到最小’因此G 当平均预测误差最小时G 所对应的嵌入维数就是恰当的嵌入维数’但该方法存在的不足之处在于; @E 没有考虑到时间延迟对平 作者简介; 岳毅宏A 男G 河南林州人G 副教授G 博士G 从事混沌控制H 复杂系统等研究? 韩文秀A 女G 山@C B 6FE G @C #=FE G 万方数据 东济南人G 教授G 博士生导师G 从事复杂系统H 混沌系统及控制等研究’ 第G 期岳毅宏等‘多变量时间序列相空间重构中参数的确定 " a + 均预测误差的影响! 没" #在计算平均预测误差时$有将所有变量都考虑在内% 基于此$本文对以上方法进行改进和扩展$并将改进和扩展后的方法称为基于平均预测误差最小化的相空间重构参数确定法%相对于基于&零级近似’模型的嵌入维数确定法$该方法具有明显的优越性% 间延迟9这样就形成了一对矛盾%通常情况下$在$-求取9值之前$必须假定:的取值$但该值并不一定--就是恰当的嵌入维数值%这必然会影响恰当时间延本文在文献K 提出一种基于平均预测G M 的基础上$该方法能够误差最小化的相空间重构参数确定法% 同时求得恰当的时间延迟和嵌入维数$而且所求得的重构参数值更为优化% 由式5I #可以得到变量*-的未来状态/-$7? +与 相空间矢量6但实践中函数7之间的函数关系$迟的计算$进而影响到相空间的重构质量%基于此$ (多变量时间序列的相空间重构 假定某系统有) 个可测变量*+$对*" $,$*) $应于每个变量*-的时间序列为. /1$02+$" $,$-$0 首先将序列. 形成序列4即3%/1合并$$-$0 42. /+$+$/+$" $,$/+$3$/" $+$/" $" $,$/" $3$,$/)$+$/)$" $,$/)$31%5+# 重构序列4的相空间 6725/+$7$/+$789+$,$/+$785:+8+#9+ $/" $7$/" $789" $,$/" $785:" 8+#9" $,$/)$7$/)$789) $,$/)$785:) 8+#9) #$5" # 72+; >-<>)=. 5:-8+#9-1? +$+; >-<>) =. 5:-8+#9- 1? " $,$3%式中9-和:-5-2+$" $,$)#分别表示时间延迟和嵌入维数%根据嵌入定理$存在:维空间上的一个光滑 ) 函数@A B :C B : E 其中:2D :--2+ F $使得67? +2@567 #%5G # 若:或每个:-都充分大$ 则式5G #可写成/+$7? +2@+567#$/" $7? +2@" 567 #$H /)$7? +2@) 567 #%5I #对于以上过程$关键问题在于选定恰当的时间延迟9-及嵌入维数:-$-2+$" $,$)$这样才能使得式5" #和5G #成立% J 基于平均预测误差最小化的重构参数确定法 选择一个好的时间延迟9-非常重要$ 因为它可有效降低所需的重构嵌入维数$ 从而使问题相对简化%对于单变量序列$选择时间延迟的方法很多$比 如平均位移法K L M N 互信息法K O M N 自相关函数法K P M 等%文献K G M 就是利用这些方法分别对多变量时间序列中的每个单变量时间序列*-25/-$+$/-$" $,$/-$3#5-2+$" $,$)#单独选取时间延迟9-! 然后利用&零级近似’模型求取恰当的嵌入维数:-$-2+$" $,$)% 在求取时间延迟万 方数据9-时$一般要求首先设定嵌入维数:-! 而在求取嵌入维数:- 时$也要求首先知道时@Q 5R #5Q 2+$" $,$)#往往是未知的%为了对变量*-的未来状态作出预测$ 必须选用适当的模型来逼近函数@Q 5R #%目前已有的逼近模型很多$比如线性回归模型N 径向基函数模型N 人工神经网络模型N 小波网络模型等%在此设函数@Q 5R #的逼近模型为S @Q 5R #$则式5I #变为/T +$7? +2S @+567#$/T " $7? +2S @" 567 #$H /T )$7? +2S @) 567 #%5U #式中/T -$7? +5-2+$" $,$)#为/-$7? +的预测值%文献K G M 中所构造的误差函数V 5:+$:" $,$:) #只是针对变量*+$最终所求得的恰当嵌入维数值也 只适合于由变量*+来重构相空间$ 并不一定适用于其他变量%基于此$本文将构造针对所有变量的误差函数V 5:+$:" $,$:) ! 9+$9" $,$9) # %由于变量的单位各异$与误差函数V 5:+$:" $,$:) #采用平均绝对误差不同$本文所构造的误差函数采用平均相对误差 V 5:+$:" $,$:) ! 9+$9" $,$9) # 2) 38+T -$7? +-$7? + )538W X #D 5L # -2+D 72W /-$7? +%式中/T X -$7? +为/-$7? +的预测值$ 且W X 2+; >-<>) =5:-8+#9-? + %5O # 由式5L #可知$误差V 值的大小完全取决于维数:+ $:" $,$:) 及时间延迟9+$9" $,$9) $ 能使V 取值最小的嵌入维数:Y +$:Y " $,$:Y ) 及时间延迟9Y +$9Y " $,$9Y ) $就是所求的恰当嵌入维数及时间延迟$即 5:Y +$:Y " $,$:Y ) ! 9Y +$9Y " $,$9Y ) # 2 A :-$9-^_? $-2+$" $,$)1%5P # 式中_? 表示所有正整数的集合% 关于以上确定嵌入维数及时间延迟的方法$需要对以下几点作进一步说明‘ +#在式5U #中$S @+5R #$S @" 5R #$,$S @) 5 R #可采用 , @, 控制与决策 第, 9卷 多种不同的模型! 比如零级近似模型" 全域线性回归模型" 局域线性回归模型" 人工神经网络模型" 小波 %网络模型等#一般情况下! 为了便于计算! $’() ’&*& 只是模型参数不同+! , ! -! .) 通常采用同一模型! 需要指出的是! 若选取的逼近模型不同! 则计而已# 算量及函数/的最小值’0! 0! -! 02! 2! -! 2+, . 1+, . ) 333 可能存在较大差异! 但最终所求得的’0! 0! -! 0+, . ) 333及’的值应是相同的#2! 2! -! 2+, . ) 量" 成交金额和换手率等#因此! 该系统非常适合于研究多变量时间序列的相空间重构# 文献H 该+9I 介绍了一种相空间重构预测算法! 方法的原理是直接借助于相空间重构技术对时间序列的未来状态作出预测#相空间重构质量的高低直接决定着预测的精度! 而重构参数的恰当与否决定着相空间重构的质量#基于此! 本文利用该预测算法来检验上述重构参数确定方法相对于文献H 4I 方法所具有的优越性# 目标序列为单变量时间序列! , ) 当. *+时! 此时上述方法依然适用#因此! 该方法对单变量和多本文选用上海证券交易所+@@U Y 9U Y , @Z 变量时间序列的相空间重构具有普遍的适用性#4) 以上方法采用了单步预测来确定恰当嵌入 维数’03+! 03, ! -! 03. ) 及恰当时间延迟’23+! 23 , ! -! 23 . ) #需要指出的是! 效果良好的单步预测并不意味着可以取得效果良好的多步预测! 因此可基于多步 预测法来定义/! 即/’0+! 0, ! -! 0. 12+! 2, ! -! 2. ) *. 567? =:7 .’567689:+) ; #<*+;>*+;> >=:7’@) 此外! /也可采取以下形式A /’0+! 0, ! -! 0. 12+! 2, ! -! 2. ) *. 567.’567689:+) ; <*+;>*+;> ==*8 +B :F=:F EF C E7D #9 >=:F’+9) 式’@) 和’+9) 中A 7为给定的预测步数! >? =:7为 >=:7的预测值#式’@) 采用的是直接预测法! 式’+9) 采用的是逐项迭代预测法# 若原始序列G 是混沌序列! 则预测步数7应满足7E 7B C D ! 7B C D 为最大可预测尺度! 其计算方法参见文献H @I #J ) 通常情况下! 为了控制计算量! 一般预先设定最大嵌入维数0B C D 及最大时间延迟2B C D ! 则式’K ) 可改写为 ’03+! 03, ! -! 03. 123+! 23, ! -! 23. ) *C L MB N O P /’0+! 0, ! -! 0. 12+! 2, ! -! 2. ) Q 0 2 ! 0 ! <*+! ,="" !="" -!="" .t="">*+!> U ) 在一维情形下’即. *+) ! 当逼近模型 %$&’() 采用零级近似模型时! 上述方法与伪邻近点法’即V W W 法) 具有明显的联系#事实上! 伪邻近点法可以直接扩展应用到多维的情形# X 实例研究 研究结果表明! 股票指数所反映的动力系统是一个具有低自由度的混沌系统万 方数据! 而且除了股票指数之外! 该系统仍有多个输出变量是可测的! 比如成交 , 99+Y +, Y 4+期间每日的收市指数’[+) " 成交量’[, ) 以及成交金额’[4) 组成的时间序列P >+! 组成的时间序列P ] T ’<*+! ,="" !="" -!="" +j="" )="" 作为测试序列1然后应用相空间重构算法来拟合测试序列p="">*+!> 按照文献H 4I 所述的重构参数确定方法! 首先基于平均位移法H \I 分别求取序列P >+! T ! P >4! , *, ! 23 4*4 1然后求取各个序列的恰当嵌入维数#在此取初始嵌入维数0+*0, *04*+ ! 设定嵌入维数的最大值为0B C D *+U #计算结果表明! 当0+*\! 0, * J ! 04*^时! 误差函数/’0+! 0, ! 04 ) 的值达到最小! 因此恰当嵌入维数为03+*\! 03, *J ! 03 4*^ #同理! 按照本文方法求取恰当重构参数! 取初始嵌入维数及时间延迟分别为0+*0, *04*+! 2+*2, *24*+! 设定嵌入维数及时间延迟的最大值分别为0B C D *+U ! 2B C D *+ 9#此时式’++) 可变换为’03+! 03, ! 034123+! 23, ! 234 ) *C L MB N O P /’0+! 0, ! 0412+! 2, ! 24 ) Q 0+! 0, ! 04*+! , ! -! +U 12+! 2, ! 24*+ ! , ! -! +9T #鉴于零级近似模型具有计算量较小的特点! 本 文选用该模型来逼近函数$+’() ! $, ’() ! $4 ’() #计算结果表明! 当0+*04*U ! 0, *J ! 2+*\! 2, *4 ! 24*U 时! 误差函数值/’0+! 0, ! 0412+! 2, ! 24 ) 最小! 恰当嵌入维数及时间延迟的值分别为03+*03 4*U ! 03, *J ! 23+*\! 23, *4! 23 4*U #基于以上所求得的两组重构参数! 分别得到下 列重构相空间A _’=+) *’>+! =! >+! =6J ! >+! =6K ! >+! =6+, ! >+! =6+\! >+! =6, 9 ! >, ! =! >, ! =6, ! >, ! =6J ! >, ! =6\ ! >4! =! >4! =64! >4! =6\! >4! =6@! >4! =6+, ! >4! =6+U ! >4! =6+K ) ! 第. 期岳毅宏等l 多变量时间序列相空间重构中参数的确定 #/. " #$ ! ’) ’) ’) ’) ’) () %() %*+() %*(#() %*(, () %*#-%&" =. >j ) OK ) x 2P I Vu S I L T r Y K K M7X S M Q I S U Y Z Z~K ! S L r L I " S R M =>2#//, ) " " Y X Q S ! I U S I Q KQ S " KM K U S K M x $4b 5_]\) (W U V (#(" (o #$l <0o ,="" ,="">0o> =->陆婕) 顾圣士) 蒋馥2多维时间序列在相空间重构中的 应用=洛阳大学学报)#>211#) (<" #$l /o (. 2x " ) %) x 27n u Yx Ymm S I L TN n X S R I Q S V LV W " Y X Q S ! I U S I Q K >2y z Q S " K M K U S K M S L R V L M Q U Y R Q S L T n t I M K M n I R K =x {)#11#) (<" #$l /o (. 2$&g z 4]%’(%5) d h b 5c 4 =0>王永忠) 曾昭磐2混沌时间序列的局域线性回归预测方 法=厦门大学学报)(>2///) . , " -$l +. +o +-12x " ) +27X sI L T *+K L T +q V R I X U K T U K M M S V LW V U K R I M Q S L T >2y z " K Q t V Z V W R t I V Q S R Q S " K M K U S K M =x {, 5]^d %)(///) . , " -$l +. +o +-12$(%5) d h b 5c 4 ) u 2-=+>-V M K L M U K S LO H ) j V X X S L Mxx Y R Ij K R V L M Q U Y R Q S V L o K . n I L M S V LI M IT K V " K Q U r [I M K ZW U I " K /V U JW V U R t V V M S L T =>2#//-) <. "="" ($l="" ,="" #o="" ,="" n="" u="" v="" n="" k="" u="" z="" k="" x="" i="" rq="" s="" "="" k="" x="" $4b="" 5_]\)(=""><>N U I M K U 7O 20L W V U " I Q S V L I L Z K L Q U V n r S L M Q U I L T K #+#2 =, >7[) k ) m ) K 2H I U [I L K X p P 0U V /L -S Z V U V /S R tx x Q I X t K =>22I L I X r M S MV W V [M K U ! K ZZ I Q IS Ln t r M S R I X M r M Q K " M x d ) )(//. ) +0" -$l (. . (o (. /#23z e #$4 系统工=/>岳毅宏) 韩文秀2混沌系统可预测尺度研究=>2x ) ’) ’) ’) ’#) %#) %*.#) %*+#) %*/ ’) ’) ’) ’) ’$2. ) %. ) %*0. ) %*(1. ) %*(0. ) %*#1 为了验证以上所求得的两组重构参数的优劣 " ($" #$ 本文分别以相空间! 应用相空性) %和! %为基础) 间重构预测算法来拟合测试序列3并利用下式46) 5: 55 78" ! $&) " (0$%9(-545&( " ($ 式中! 经计算得到78" ! &%表示重构相空间2%$ " #$" #$ 的值明显小. 2/, ;) 78" ! &(2(<;278" !="">;278"> (-" ($" #$ 于78其根本原因在于相空间! " ! ) %$%的重构质 " ($ 量大大优于相空间! 而相空间的重构质量则完%) 计算平均拟合误差2 全取决于重构参数的选择2以上过程验证了本文方法相对于文献=. >方法的优越性2 ? 结 语 本文首先介绍了多变量时间序列相空间重构理论@然后提出一种基于平均预测误差最小化的相空间重构参数确定法2该方法能够同时确定重构嵌入维数及时间延迟) 而且所求得的重构参数更为优化2最后将所提出方法应用于股票市场非线性动力系统的相空间重构) 通过比较和分析) 验证了该方法的优越性2 参考文献" $A B C B D B E F B G =(>H 2P I J K L MN OI L K K Q K R Q S L TM Q U I L T KI Q Q U I R Q V U MS LW X Y S Z =2\=>2Q Y U [Y X K L R K 7>4%]^5_]‘a 4b c d ^b ]%ef g h i g ‘d %_d j l m )(/, (l #(o , 12k K U X S L n U S L T K U =#>p I ) H 27M M Q S L T M mq U V r s j t V V Q S L T I n n U V I R tQ V R t I V M >2y z S L Q t K u V U K L v K w Y I Q S V L M =x {\5{{d h d %c 5]‘)(//+) (#<" ($l -(o 0. 2|}g ]c 5z %b =>21/, /) . 0" #$l #-0o I Q Q U I R Q V U M x |||f h ]%b z %1f )( 程理论与实践)#11. ) #. " +$l /(o /02 =>2a *f R t I V Q S RM r M Q K " M x 4b c d ^b |%’5%d d h 5%’$d z h 4]%e )#11. ) #. " +$l /(o /02$#h ]_c 5_d 韩怀中) 罗超2结合混沌预测的改进的5%=(1>薛福珍) *控 制方法=控制与决策)#>211#) (<" 0$l 0. +o 0-12x " ) p I ) u 27X Lp +Y Vj T V U S Q t 4Y KN +" R V " [S L S L T R t I V Mn U K Z S R Q S V L /S Q tS " n U V ! K Z 5%*R V L Q U V X " K Q t V Z )#11#) (<" 0$l 0. +o 0-12$=>26x z %c h z ‘]%e\d _5b 5z % " 2m *Y K *p ) p I Ls 4Q Y Z rV LQ t K n U K Z S R Q I [X KM S v KV W 77777777777777777777777777777777777777777777777777 上接第#" , /页$ =->u ) x 2m S ! I L S O 7) ~I S M K Ux S Is x R t K Z Y X S L Tt I U ZI L Z o M V W Q U K I X Q S " K R V " " Y L S R I Q S V L S L I R V L Q U V X X K U I U K I =>26)(///) =0>sI ) k 28X M t %j K X Z S " I L 5) k Y M t L K X X u U U V UK L R V Z S L T =2#, I X T V U S Q t " M W V U L K Q /V U J K ZR V L Q U V X 7>h z _z {c$d . c $=>2q )(///)0l 6z %{z%\d _5b 5z %]%e 6z %c h z ‘j t V K L S . -/. . o -/. , 2 =+>q ) 7X 28K Z U K S U I Mq " K S Z Iu P N " K M M I T KM R t K Z Y X S L TV L >26R V L Q U V X X K UI U K IL K Q /V U J =x z ^8g c 5%’]%e 6z %c h z ‘)#11#)(. " -$l (+.o (<12|%’5%d d="" h="">12|%’5%d> =<>9V o X Q K H ) m :V Z S L O ) p I L M M V L p 2m K U ! K U [I M K Z =; >) ///22M R t K Z Y X S L TV W Q t Kj 79[Y M 8k 5u " U Q R 2; ; 10. -2) OI )#11. 2" Z t M K n Y [X S R I Q S V L M n Z W r =, >j o K L I %) )#11#)/" +$l (#1#o (#(. 2|‘d _c h z %5_b =>21R V L Q U V X X K U I U K I L K Q /V U J M x |||fh ]%b z %1%e g b c h 5]‘ 万方数据 第7章 多变量时间序列模型 §1 Granger 因果检验 判断一个变量的变化是否是另一个变量变化的原因,是经济计量学中的常见问题。 Granger提出一个判断因果关系的一个检验,这就是Granger 因果检验。 一.Granger因果检验的思想 如果x影响y,或者x是y的原因,此时x的变化必然先于y的变化,此时就须满足 两个条件: 1)x可以预测y,即根据y的过去值对y进行回归时,如果加上x的过去值,能显著增强回归的解释能力。 2)不能根据y预测x,因为如果根据x预测y,又能根据y预测x,很可能x和y都是由第三个或其他变量决定。 二.检验步骤 1)首先检验零假设“x不影响y”即x不是y的granger原因。首先根据x和y的滞后值对y回归(无限制回归),然后用y的滞后值对y进行回归(有限制回归)。即: 无限制回归:yt=α0+ ∑αy ii=1m m t-i +∑βjxt-j+ε1t i=1 m 有限制回归:yt=α0+ ∑αy ii=1 t-i +ε2t 用F检验来判断x是否显著了了无限制回归的解释能力。此时统计量 RSS(F= * -RSS)RSSn-k-1 F(r,n-k-1) RSS*是有限制回归的残差平方和,RSS使无限制回归的残差平方和。n是样本容量,k 使无限制回归变量的个数。r是限制回归模型中的变量个数。 2)检验y不影响x,即x不是y的granger原因。此时调换模型中的变量x和y的位置,利用F统计量来检验。 三.如果一对时间序列是协整的,则至少在某一方面存在granger原因。 §2 伪回归 一.现在考虑非平稳序列回归出现的问题 设{yt} {xt}是两个无关的随机游走过程, yt=yt-1+εt εt IID(0,σε2)xt=xt-1+ut ut IID(0,σ 2u ) 且E(usεt)=0,任意的t,s。此时xt既不影响yt,也不受yt的影响。 建立模型yt=c+βxt+et 对于这种情况,β?0,R→0 。 p 2 Banerjee利用蒙特卡罗模拟得出结论:对于相互独立的单整序列{yt} {xt},且 σu=1,σε=1,x0=0,y0=0,进行回归时,t统计量显示了比正常检验临界值水平还高。 也就是在相互独立的序列进行的实际回归中,经常伴随着高的R,并且β系数显著。这种现象就称为为回归现象。 2 二.伪回归的产生原因 1.伪回归现象产生的根本原因就是序列的非平稳性。设{yt} {xt}是两个无关的随机游 2 走过程,并假设模型为yt=α+βxt+et,vt IN0,σu,此时建立统计推断: () 原假设H0:β=0 ?=此时根据OLS估计,β xy x t2t t ?的分。因为{yt} {xt}是两个无关的随机游走,则β 子,分母均为一种维纳过程泛函。(参见hendry和秦朵的《动态经济计量学》第三章)。 2.W(r)和V(r)表示定义在r∈[0,1]上的两个相互独立的维纳过程,则 T ε t=1 [Tr] t ?W(r)t=1u [Tr] t ?V(r) 于是可以证明: T -2 ∑y t=1 2t ?σε??W(r)??dr 0? 2 1 2 T -2 ∑x t=1T T 2t ?σ 12u0 ?V(r)??dr ?? 1 2 T -2 ∑xtyt?σεσu?W(r)V(r)dr t=1 ??于是β σεσu?W(r)V(r)dr 1 σu2???V(r)??dr 1 2 ? σε?W(r)V(r)dr 1 σu???V(r)??dr 1 2 →0 但在零假设β=0条件下, -2T???-2T2??-2T2??-2T? t=T∑ytxt? ?T∑xt??T∑yt?-?T∑ytxt? t=1t=1t=1t=1? ??????? 2 ? ? ?? -1此时有两个特点:1)发散。2)分布不是常规的分布。从而利用t统计量不能得到正确的检验。直观地看一下: yt=α+βxt+et,如果β=0,则et也是I(1)过程非平稳。从而最小二乘估计不可用。三.伪回归检验 我们利用残差的平稳性检验来判断是否存在伪回归。如果残差非平稳,则是伪回归。 四.伪回归的纠正方法: 1)在回归模型中包含自变量和因变量的一阶滞后变量,即 yt=α+βxt+φyt-1+δxt-1+ut ?和δ?依概率收敛于零。 此时能够消除伪回归。即当y和x不相关,则β 2)对yt和xt先做一阶差分,从而使得{?yt}和{?xt}变成平稳过程,建立模型 ?yt=α+β?xt+ut ?依概率收敛于零。 此时能够消除伪回归。即当y和x不相关,则β 3)Cochrane-Orcutt方法(自相关问题) 如果yt=α+βxt+ut,这里ut=ρut-1+εt 则根据广义差分法,建立模型 yt-ρyt-1=α(1-ρ)+β(xt-ρxt-1)+εt ?依概率收敛于零。 进行迭代估计,可以证明β 五.总结 1)伪回归现象:对于任何两个(或两个以上)不相关的单位根过程,只要样本量足够大,检验他们相关性的统计量一定呈显著性,这就是伪回归现象。 2)回归分析将平稳过程当作非平稳过程来处理是十分危险的。因此回归中必须分清平稳过程和非平稳过程。 3)伪回归的本质问题是变量的非平稳性。 §3 协整 一.定义 1.零阶整I(0):对于n维线性过程Xt= ∑Cε i=0 ∞ it-i ,如果 ∑C i=0 ∞ i ≠0,Ci为系数, εt IID(0,σ2),则称Xt为零阶整的。 2.1阶整I(1):如果?xt为I(0)过程,则n维随机过程Xt称为1阶整的。I(1)过程都是非平稳的,但非平稳性可以通过差分消除。这里任何形式为Xt=C当C≠0时,都是I(1)过程, 3.协整:如果Xt为1阶整的,但对于某些线性组合,只要恰当的选择β'X0,β≠0, ∑ε+∑Cε ii=1 i=0 t∞ it-i , β'Xt变为平稳的,则Xt称为协整,β称为协整向量,线性不相关的协整向量数目称为 协整的秩。协整向量张成的空间称为协整空间。即表示为β'Xt I(0)。 二.说明 1)协整向量β至少有两个非零元素。 2)对于常数C,Cβ都是协整向量。 3)对于k个线性无关的Xt,β=(β1,...,βk)满秩,则β'Xt平稳。 三.协整的意义 1.协整可以用来描述某些经济变量水平值间存在稳定的长期关系,也就是某些经济变量之间不能相互分离太远。也就是如果变量不存在协整性,他们可以任意分离。 协整向量 可以认为是经济系统中对变量长期行为的限制条件。 2.协整响亮多好还是少好 协整向量多,经济系统就越稳定,即在尽可能多的方向上存在稳定的关系。 协整向量少,经济模型存在唯一的稳定状态均衡,这样能够获得协整向量的精确估计。 四.协整于长期均衡的联系 如果yt-βxt=ut,ut I(0),yt,xt I(1),则此时yt和xt协整。这里ut可以测量“系统”的失衡程度,可以称为均衡误差。如果是协整的,ut I(0),均衡误差具有均值回返特性。如果不是协整的,则ut I(1),则均衡误差将会出现剧烈波动,不具有均值回返特性。 五.协整和伪回归的关系 对于 yt=yt-1+εt εt IID(0,σε2)xt=xt-1+ut ut IID(0,σ 2u ) , ?σu2 yt=βxt+vt,Philips证明伪回归的长期协方差矩阵∑S=? ?σεuσεu? ?非奇异。当σε2? ρvε=0时,此时系统残差非平稳,为伪回归。而对于协整方程,长期协方差矩阵 ?σu2 ∑S=?σ ?εu σεu?σu2σεuσεu 奇异。此时,从而ρ==1。残差矩阵奇异是=0uε2?2 σε?σεσuεuσε 系统为协整过程的必要条件。 六.协整检验 1.对于回归模型yt=βxt+ut 我们检查ut的生成过程:ut=ρut-1+εt是否是单位根过程。此种方法就是E-G两步法。 2.Machinnon检验方法:小样本方法 是一种从一般到特殊的检验方法: 对于k个I(1)序列x1t,x2t,....,xkt,k≥1,t=1,2,....,T 可以建立三种协整回归方程 (1) x1t= ∑βx jj=1 k jt +μt (2) x1t=α0+ ∑βx j j=2 k k jt +μt (3) x1t=α0+α1t+ ∑βx j j=2 jt +μt μt为扰动项。协整检验的基本方法就是检验其扰动项的平稳性, 利用ADF检验: l ?t-i+εt ?t-1+∑γi?u?t=(ρ-1)u?u i=1 ?t-i+εt ?t-1+∑γi?u?t=δ0+(ρ-1)u?u i=1 l ?t-i+εt ?t-1+∑γi?u?t=δ0+δ1t+(ρ-1)u?u i=1 l 原假设:ρ=1,备则假设ρ<> §3 误差修正模型ECM(E-G两步法) 作用:模型取决于解释变量与因变量长期关系得偏离以及对这些因变量的调整。 一.设两个经济序列yt和xt是I(1)过程,并且是协整的,协整向量为(1,-β),则设 yt*=f(xt)=βxt,于是?yt=α?xt+θ(yt-1-βxt-1)+ut,则这种模型称为误差修正模 型ECM。 这个模型需要?yt对?xt,yt-1,xt-1进行回归。因此误差修正项yt-1-βxt-1的系数可作为前期的y对βx之间偏离程度的测定及偏离的短期调整。从而ECM不再是使用变量的水平值或变量的差分变量来建模,而是把两者有机的结合起来。 短期看,?y是由较稳定的长期趋势和短期波动所决定,短期内系统对于均衡状态的偏离程度的大小直接导致波动振幅的大小。 长期看,协整关系式起到吸引力的作用,将非均衡状态拉回到均衡状态。 ECM能清楚地显示出于长期均衡偏离的程度,所以立刻显示出关于这种偏离的调整信息。 二.E-G两步法的估计步骤 方法1.建立静态模型:yt=α+βxt+ut,进行最小二乘估计并进行协整检验。利用误 ?t=yt-α-βxt,建立模型?yt=a?xt+θu?t-1+εt。利用OLS估计参数,得差修正项u 到误差修正模型。 方法2.直接估计yt=cyt-1+c2xt+c3xt-1+εt。 §4 VAR模型 一. 多元动态线性回归模型 1.多元线性回归模型形式为 yt=β1xt1+β2xt2+...+βkxtk+εt 可以写成yt=Xβ+εt 2.动态多元线性回归模型 yt=α0+∑αiyt-i+∑βixt-i+ut i=1 i=0 mm 表示为Y=Xβ+u 3.如果y=(y1,....,yn)'是一组向量,X=(X1,...,Xk),则 yt=C+∑Ai'yt-i+∑Bi'xt-i+ut i=1 i=0 mm 这个模型就称为动态多变量回归模型或动态结构模型。这里C为n?1向量,(A1,...,Am)是n?n系数矩阵,(B1,...,Bk)是k?n系数矩阵。ut为n?1误差向量。满足 * E(ut)=EutYt*=0 -1,Xt () ?Ω t=s** '' E(utus)=EutusYt-1,Xt=? ?0 t≠s () yt*-1=(yt-1,....,y1)x=(xt,....,x1) *t 对于动态结构模型,如果能够写成如下形式 Xt=∑CiXt-i+ut i=1 m 模型称为VAR模型(向量自回归模型)。向量自回归模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归。 4.VAR模型的扩展VARMA模型 Xt=∑φiXt-i+∑θiut-i+ut i=1 j=1 pq 或者写为φ(B)yt=θ(B)ut。 5.对于k阶VAR模型,可以写为VAR(k) Xt=∑CiXt-i+ut=C1Yt-1+C2Yt-2+...+CkYt-k+ut i=1 k 这里ut IID(0,Ω),其中C1,...,Ck都是n?n阶系数矩阵,ut为n?1阶随机误差项向量。 Ω是N?N阶方差协方差矩阵。 6.VAR(2)模型为 ?yt??C111C112??yt-1??C211C212??yt-2??u1t? ?= ?+ ?+ ? ? ? xCCxCCx122??t-1??221222??t-2??u2t??t??121 或者写成 yt=C111yt-1+C112xt-1+C211yt-2+C212xt-2+u1txt=C121yt-1+C122xt-1+C221yt-2+C222xt-2+u2t 根据误差项的假设,可以用OLS进行估计。 二. 滞后阶数k的确定: k过大,自由度降低。k过小,误差项自相关较严重。 1.LR统计量(似然比统计量) 2 LR=-2(logL(k)-logL(k+1)) χn2 这里k表示模型中滞后变量的最大滞后期,logL(k)和logL(k+1)分别为VAR(k)和 VAR(k+1)模型的极大似然估计值。极大似然估计的最大值为 logL(C1,...,CkX1,...,XT)=C0- T? logΩ 2 1T? tu?t'Ω=∑u Tt=1 其中 TNTNTNC0=-log(2π)-=-(log(2π)+1)222 2 此时LR统计量渐进服从χn2分布。当LR>LR临界值时,表示统计量显著,此时表 () 示增加滞后值能够显著增大极大似然的估计值。 2.AIC赤池信息准则 ?1T2?2k ?t?+ AIC=log ∑u ?Tt=1?T ?t表示残差,T表示样本容量,k表示最大滞后期。 u 3.SC舒瓦茨准则(BIC) ?1T2?klogT ?t?+ BIC=log ∑u T?Tt=1? 三.VAR模型的特点: 1.VAR不宜严格的经济理论为依据,在建模过程中仅需要确定两件事:1)共有那些变 量相互之间有关系。2)确定滞后期。 2.VAR模型没有参数的零约束。 3.VAR模型中有相当多的参数需要估计。 §5 VAR模型的协整 一.对于VAR模型 Yt=∏1Yt-1+∏2Yt-2+...+∏kYt-k+ut (1) 这里ut IID(0,Ω)。如果Yt I(1)非平稳,则变换参数 ?Yt=Γ1?Yt-1+Γ2?Yt-2+...+Γk-1?Yt-k+1+∏Yt-k+ut (2) 其中?为一阶差分算子,?Yt表示对向量Yt中全部变量取一阶差分后的N?1阶列向量。 Γi=-I+∏1+...+∏i,i=1,...,k ∏=Fk=-I+∏1+....+∏k称为影响矩阵或压缩矩阵。 从(1)到(2)的变换称为协整变换。因为Yt I(1),所以?Yt I(0) 于是,如果∏Yt-k非平稳,则Yt的分量不存在协整关系。如果∏Yt-k平稳,则Yt的分量存在协整关系。 二.∏Yt-k的特征 两种极端情形: 1)Yt所包含的变量不存在任何协整关系,如果∏Yt-k平稳,则必然∏=0,rk(∏)=0。 2)Yt所包含的变量不存在任何协整关系,rk(∏)=N,如果∏Yt-k平稳,则必然Yt所包含的变量都是平稳的。 第三种情形:如果Yt非平稳,则∏Yt-k平稳意味着Yt中的变量一定存在协整关系。此时则此时∏可以分解为∏=αβ',其中α,β都是N?r矩阵,β称rk(∏)=r,0<><> 作协整参数矩阵,β的每一列都是一个协整向量,β=(β1,...,βr)共有r个协整向量 β'Yt-k I(0)。 结论:协整向量的最大可能个数是r=N-1。 ?β1? ? β2? 此时∏Yt-k=αβ'Yt-k=(α1,α2,...,αr) .?Yt-k具有误差修正形式。 ? .? β??r? 三.协整参数矩阵的估计(JOHANSEN估计):要正确的估计r 其估计是在∏=αβ'成立条件下,通过选择不同的r值,对极大似然法对VAR模型 ?Yt=Γ1?Yt-1+Γ2?Yt-2+...+Γk-1?Yt-k+1+∏Yt-k+ut进行估计。 估计过程如下: 1.用样本数据确定协整参数矩阵β的秩r,对于任何r≤N,模型的零假设是: H0:r(∏)≤r,或者说∏=αβ'。其中α,β都是N?r矩阵。 2. 构造LR统计量,得到极大似然函数: logL(Γ1,...,Γk-1,∏Y1,...,YT)=C0-T? logΩ2 T1?=∑u tu?t'ΩTt=1其中 TNTNTNC0=-log(2π)-=-(log(2π)+1)222 为了除去I(0)变量,而考察∏Yt-k,则进行最小二乘回归: 1) ?Yt对?Yt-1,?Yt-2,....,?Yt-k+1进行最小二乘回归,求得残差R0t=?Yt-??Y∑Γi i=1 k-1 i=1k-1t-i。 2) Yt-k对?Yt-1,?Yt-2,....,?Yt-k+1进行最小二乘回归,求得残差Rkt=Yt-k- ?Y∑Γit-i。 ''令Xt=(?Yt'-1,?Yt-2,...,?Yt-k+1),则 ?T( Γ1,...,Γk-1)= ∑?YtXt'?t=1 ?T ( Γ1,...,Γk-1)= ∑Yt-kXt'?t=1 此时建立如下统计量 ?'XX∑tt? t=1? ∑XX'??ttt=1TT? ?N?LR=-T?∑log(1-λi)?,r=0,1,...,N-1 ?i=1? 在零假设下: ??LR tr???a(?10''W(i)dW(i))(?10W(i)W(i)'di)(-1??'WidWi()()? ?0??1) W(i)表示(N-r)维维纳过程。tr(.)表示迹。于是LR统计量也称为迹统计量,此时协整检验也称为迹检验。 用迹统计量检验H0:r(∏)≤r,或者说∏=αβ'是一个连续的检验过程。方法是首先从检验r=0开始,即检验模型?Yt=Γ1?Yt-1+Γ2?Yt-2+...+Γk-1?Yt-k+1+∏Yt-k+ut中不存在协整向量。如果不能拒绝,则检验到此为止。如果拒绝,接下来检验r≤1,r≤2,...,直到不能拒绝r≤r,但拒 11 * **绝r≤r-1,此时模型中包含r个协整向量。如果检验r≠0,则 即它?Yt=Γ1?Yt-1+Γ?...+Γk-?Yt1-k++∏2Yt-+21Yt-k+ut模型称为向量误差修正模型, ?=αβ??',从而估计出是以协整关系为约束条件的VAR模型。确定r之后,就可估计出∏ ?Yt=Γ1?Yt-1+Γ2?Yt-2+...+Γk-1?Yt-k+1+∏Yt-k+ut的参数Γi。 12 转载请注明出处范文大全网 » 一种多对象时间序列数据存储设范文四:多变量时间序列相空间重构中参数的确定
范文五:多变量时间序列模型