《数学软件》实验报告 实验名称:向量的距离与夹角余弦 使用软件: matlab
实
验 熟练掌握向量的各种距离的计算,熟悉夹角余弦的公式,掌握判别分析建模的基本方法 目
的
1.设a=[1,2,3],b=[4,5,6],求a,b的数量积,矢量积与范数; 2.设三只蠓虫的触长、翅长分别为(1.28,1.86),(1.24,1.68),(1.42,2.05),求三只蠓
虫之间的向量的欧氏、绝对距离、闵可夫斯基距离(r=3)和马氏距离。 实
程序如下: 验 a=[1,2,3];
内 b=[4,5,6];
A=[1.28,1.86;1.24,1.68;1.42,2.05]; 容a1=dot(a,b) (具a2=cross(a,b) 体题a3=norm(a) 目及a4=norm(b) 程d1=(pdist(A))' 序) d2=(pdist(A,'cityblock'))'
d3=(pdist(A,'minkowski',3))'
d4=(pdist(A,'mahal'))'
1
数量积为:
实 a1 =
验 32
结 矢量积为: 果 a2 =
分 -3 6 -3
析 a的范数为:
a3 =
3.7417
b的范数为:
a4 =
8.7750
欧氏距离为:
d1 =
0.1844
0.2360
0.4115
绝对距离为:
d2 =
0.2200
0.3300
0.5500
闵可夫斯基距离(r=3)为:
d3 =
0.1807
0.2126
0.3837
马氏距离为:
d4 =
2.0000
2.0000 2
2.0000
成 绩
3
基于向量夹角余弦的IOWGA算子组合预测模型
V01(33 No(9第33卷第9期 合肥工业大学学报(自然科学版) UNIVERSITY OF HEFEITECHN()LOGYJOURNAI(OF 2010年9月 Sept(2010
Doi:10(3969,j(issn(1003—5060(2010(09(033
基于向量夹角余弦的IOWGA算子组合预测模型 娟, 赵 周礼刚, 陈华友, 丁子千
(安徽大学数学科学学院,安徽合肥230039) 摘要:文章将向量夹角余弦和10wGA算子相结合,提出一种基于向量央角余弦的I()WGA算子最优组
合 预测模型,并定义‘r优性组合预测的概念;通过对税收收入进行组合预测说明了该组合预测方法足有效 的和 合理的,且该模型存在优性组合预测。 关键词:向量夹角余弦;I()wGA算子;组合预测;优性组合预测 中图分类号:0221(2 文献标志码:A 文章编号:1003—5060(2010)09—1425—05 Combination model based on vectorial forecasting
cosine and IOWGA angle operator
CHEN Juan, ZHOUZHAoDINGLi—gang, Hua—you, Zi—qian Mathematical of (SchoolSciences,AnhuiUniversity,Hefei230039,China) model is based the combina— onAbstract:In this combination paper,an optimal forecasting proposed
tion of vectorial and the induced ordered cosine angle weighted geometric averaging(IOWGA)opera—
tor(And the of combination is the combination fore— conception superior forecasting given(By taking tax as an combination model to be to beof revenuecasting example,the presented forecasting proved effective and reasonable and it is a kind of combination superior forecasting( ordered words:vectorial angle cosine;induced geometric averaging(I(‘)WGA)operator; Key weighted combination combination forecasting;superior forecasting
组合预测方法[1]的核心问题是如何求得各种 此,文献[10-]基于文献[11]引进诱导有序加权几
何平均(IOWGA)算子,建立了基于IOWGA单项预测方法的加权平均系数,从而提高预测的 精度。组合预测方法的理论和应用研究一直是国 子的组合预测模型;文献[123提出了基算 角余弦的组合预测模型,给出新于向量夹 内外预测界研究的热点课题L2—9],也取得了一些 可喜的成果【8’9j。 预测方法优超、冗余度等概念,研究了它的性质, 的优性组合预测、 法 从而在理论上说明了基于向量夹角余弦的组合预 传统的组合预测方法是对不同的单项预测方
测方法的有效性。文献[-133对安徽省高新技术人 赋予不同的加权平均系数,同一个单项预测方 法在样本区间上各个时点的加权平均系数是不变 才的需求量进行了预测。 的。而实际上就同一个 本文试图将向量夹角余弦和IOWGA算单项预测方法而言,它在 不同的时刻表现可能不相同,即在某个时点上预 相结合,以预测精度作为诱导变量值进行有序加 子 权几何集成,并以预测值对数序列与实际值的对 测精度较高,而在另一时点上预测精度较低,因此 数序列之间的向量夹角余弦作为目标函数,提出 现有的组合预测方法存在与现实不符的缺陷。对
收稿日期:2009—08基金项目:国家自然科学基金资助项日—10 (71071002);安徽省优秀青年科技基金资助项目(08040106835);安 徽省自然科学基金资助 项月(070416245);安徽省高等学校教学研究资助项目(2007jyxml77);安徽省高校青年教师资助项目(2007jql017, 2008jqll28);安徽大学人才队伍建设资助项日和教育部大学生实验性创新资助项目(081035703) 作者简介:周礼刚(1980一),男,安徽潜山人,博士生。安徽大学讲师; 陈华友 (1969一),男,安徽和县人,博士,安徽大学教授,博士生导师(
万方数据
1426 合)ieX-,2k大学学报(自然科学版) 第33卷
,种基于向量夹角余弦的I()WGA算子最优组 2最优组合预测模型 合预测模型;最后通过对中国税收收入进行实例
分析,说明该组合预测方法的有效性和合理性。 设某社会经济现象的指标序列的观察值为
{五,,一1,2, ,N},设有m种可行的单项预测方 1 IOWGA算子 法对其进行预测,z。为第i种预测方法第t时刻
根据文献[11],有以下定义l。 ,2, 的预测值(或称拟合值),i—l,2, ,仇,,=1
定义1设R+为正实数集,九:R一一R+,令 ,N。
otT 定义3令口t为: (1)f(aI,n2'((?,口。 )=lJ缈 f,一l警l,当l警l<1时;其中,w一(硼。,wz, ,伽。)t是与厂相关联的指数="" 加权向量,wi?[o,1],="" i,起,?戳一一1,2,="" 1,且="" 0,当l垡j?1时="" n女2气="" bi是一组数据(口,,口z,="" ,,)中第i大的元素,称="" (3)="" 函数厂为有序加权几何平均算子,简称为owga="">1时;其中,w一(硼。,wz,>
算子。 中i--_1,2, ,拂;z=1,2, ,N。 其 OWGA算子是对咒个数a,,口。, ,n。按从 显然口。?[o,1],把预测精度口e看成预测值 大到小的顺序排序后进行有序加权几何平均,权 z。的诱导值,这样m种单项预测方法第t时刻 系数Wi与数ni无关,而是与n。,口2, ,n。的按从 预 测精度和其对应的在样本区间的预测值就 大到小的顺序排的第i个位置的数bi有关。特别m个二维数组(口n'z1。>,<口>口><口z2,>, 构成了
w,‰>。 地,当’I,一(1,0, ,o)T时,OWGA算子简化成 设,=(z,,lz,,厶)T为各种 预测方法在组
合预测中的IOWGA算子的加权向量,满 max算子,即f(at,n2, ,口。)一一ma(,xai;当w一
(o,0, ,1)T时,0WGA算子简化成rain算子, 足 ?t—l,li?O,i=1,2, ,优。将优种单 项预测方 即f(a1,口z, ,岔。)一rain口i;当’‘,一 法第t时刻预测精度序列以 铴, ,口。按从大到
小的顺序排列,设a-index(it)是第i个大的预测 (音,去, ,丢)T时,owGA算子简化成简单几 精度的下标,根据定义2,令
何平均算子,即f(a1,n2, ,,)=?口;向。 zf=g((口n,zh>,(a2”z2,>, , j坠根据文献[10],有以下定义2。 (4)z皇i,础 (a)<口。,,27。>)=ll 定义2 设<“1,a1>,(甜2,口 2>,,(材。,口。 >为则(4)式称为由预测精度序列口lf,锄, ,口。所产 二维数组,令 月 生的IOWGA算子组合预测值。
g((ul,口1> ,<“。,以。,(“2,口2> ,>)一II以‰(i) 显然(4)式表明组合预测的赋权系数与单项
预测方法无关,而是与单项预测方法在各时点上 (2) 的预测精度的大小密切相关。 则称函数g为“。,z‘z, ,“。所产生的行维诱导有 序加权平均算子, 在几何平均的组合预测模型中,为便于处理, 简称为IOWGA算子,,‘i称为 通常考虑其时问序列的对数误差。 ni盼诱导值,u-index(i)是“l,“2, ,‰中按从大 对(4)式两边取对数,得到:到小的顺序排列的第i个大的数的下标,w= (wl,砒, ,Wn)T是与g有关的加权向量,满足 In幺=?lil峨姚?,t=1 ,,N(5)2,
?Wi=1,Wi?O,i--1,2, ,挖。 令x一(1n z1,In z2, ,In zN)T表示预测对象 定义2表明IOWGA算子是对诱导值托。, z11,In z砣, ,In 实际值对数向量,x,一(In zw)T 的 “z,((?,‰按从大到小的顺序排序后所对应的口。, 表示第i种预测方法的预测值对数向量,i_--1,2, 口z'((?,口。中的数进行有序加权几何平均,权系数 ,m,R=(1n x1,In奎2, ,In主,)T表示组合 预 所在的位置有测值对数向量。 "OJi与数ni的大小和位置无关,而是与其诱导值 万方数据
定义4令弘可分别关。
为:
1427第9期 周礼刚,等:基于向量夹角余弦的IOWGA算子组合预测模型
N (10)5CtIn zi ?In s(t(?li一1,厶?0 , i;I 其中,i一1,2, ,m。该模型为一个非线性规
划 模型。可以利用Matlab最优化工具箱来求 解。设 N 样本区间上组合预测最优权系数为L’一(17, z,1 矗,?In 牙, ,,)T,根据预测连贯性的原则,可以用它 (6) 来进行预测区间[N+1,N+2, ]的组合预测,
公式为:
称准为第i种单项预测方法预测值对数向量Xi IOWGAL,(<口1f,zlf>,(n2f,z2f>, ,
ra 与预测对象实际值对数向量x的夹角余弦,叩为 (口w,zw>)一I I森抽妇(a),IOWGA算子组合预测值对数向量宕与实际值对 f=l 数向量x的夹角余弦,其中,i=1,2, ,m。 其中,f—N+1,N+2, 。在预测区间[N+l, , N+2, ]上预测精度序列钆,n2f, ,n。的大小 X。,ndex(jr),i,j=l,2, 令E|J=?In厶舭(自 )In 确定原则,是根据各个单项预测方法在样本区,优,则称mXm方阵E=(E。)。×。为基于向量 间 上近几期拟合平均精度的高低,即若要进行夹角余弦的IOWGA算子组合预测信息矩阵, k步的预测,用i种预测方法最近k期拟合平均未来 且有: 精 1 ? N N 搠 度{?口。来反映预测区间上N+k期的预测 K f=N一女十?(1n乏)2=?(?ziIn矗一c。,)2= l f=l f=1 i=1 精度。 mmN
??ziz』(?In矗眦?In如砌(冉 ))= 令枷=rain锄)表示m种单项预测值对数i=1 i=1 t=1 向量与实际值对数向量的夹角余弦中最小者, (7) ??,Eg—LTFff( 钕=max{功}表示夹角余弦中最大者,则有如下 ’ l々}f?聊。 由(7)式,(6)式可改写成(8)式,即 定义5。N 定义5设'7(Z。,Z2, ,z。)为基于向量夹角 X, t?ln丑In 孕一了孚—=一,际值对数向量的夹角余弦,若7,(1,,zz, ,,。)< (1n?2压="" 余弦的i()wga算子组合预测值对数向量与实="" 舢,则称权系数z,,="" ,z。,z。确定的组合预测模="" 37tin如姚?="" i?in="" 型为劣性组合预测,若砷。?叩(ii,12,="" ,z。)?="" 帆,则称之为非劣性组合预测,若="" ,="" 77(zt,zz,叩一型爿兰—="-一(8)" xt)2="" 、佤,y(1n="" z。)="">枷,则称之为优性组合预测。 ,高 定义5表明,只有组合预测值对数向量与其中,i_--_1,2, ,优。(8)式表明组合预测值与实
测对象实际值对数向量的夹角余弦,大于各预 际值对数向量的夹角余弦叩为各种单项预测方法 预测值对数向量与实际值对数向量的夹角的加权系数z。,12, ,厶的甬数,记为叩(zl,Z2, , 单项 最大者,则该组合预测模型才是优性余弦中 lm)。为了使组合预测值逼近实际值,希望x和文 量夹角余弦作为判断准则,优性组的。即以向 之间的夹角愈小愈好,即夹角余弦愈大愈好,故 “最好”的单项预测方法还要“好”。呀(z,,z。, ,l。)越大表示组合预测方法越有效。 合预测一定比 当文一x时,其向量夹角余弦达到最大值1。但 3预测模型在税收预测中的应用实例 是组合预测误差是不可避免的,因此基于向量夹 为了说明本文提出的基于向量夹角余弦的 角余弦的IOWGA算子组合预测模型可表示成 (9)式: IOWGA算子最优组合预测模型的有效性,下 面?li?In五In靠砌?Z(一7 Z 一‘7?m?【7 以全国税收收人预测为例说明该模型的应用,文 献[14]研究了税收收入的影响因素,本文主要讨
maxr](1l ,乙,lz)=,立与掣 ==:—一 万方数据 论影响全国税收收入的5个指标,它们分别是国
?善(1n劫2 屈瓦内生产总值、固定资产投资总额、社会消费品零售
总额、进出口总额及职工工资总额。采用3种单
1428 合肥工业大学学报(自然科学版) 第33卷
项预测方法:灰色预测法、回归预测法和多项式预 量,其它指标为解释变量。相应的预测值和预测 测法。其中回归预测法以税收收入为被解释变 精度见表1所列。
年份 税收收入实际值,亿元——————?—?=——( _=一表1税收收入各种预测方法预测值与预测精度 灰色预测 回归预测 多项式顶测 预
测值,亿元 精度 预测值,亿元 精度 预测值,亿元 精度
0(936 4 7 201(94 0(957 77 1996 6 909(82 6 987(27 0(988 8 349(43 1997 8 234(04 8 343(78 0(986 7 8 694(86 0(944 0 8 582(75 0(957 7 0(924 3 9 285(90 0(997 5 9 800(33 0(942 0 1998 9 262(80 9 963(64
1999 10 682(58 11 897(99 0(886 2 10 452(62 0(978 5 11 042(40 0(966 3 2000 14 207(87 0(870 7 12 698(92 0(990 7 12 496(67 0(993 3 12 581(51 9 92001 15 16 0(891 14 0(949 14 350(85 0(937 301(38966(192534(98 2002 17 636(45 20 260(01 0(851 2 17 261(83 0(978 8 16 792(65 0(952 2 0(998 7 009(78 0(999 62003 20 017(31 24 193(29 0(791 4 19 991(44 20
2004 24 165(68 28 890(19 0(804 5 24 750(33 0(975 8 24 189(95 0(999 0 2005 29 392(98 0(978 6 29 520(87 0(974 2 2 28 778(54 34 498(94 0(801 22006 34 804(35 41 196(58 0(816 3 35 478(91 0(980 6 36 190(25 0(960 2007 45 621(97 49 194(50 0(921 7 44 235(98 0(969 6 44 385(81 0(972 9 根据3种单项预测方法,构造出第t时刻预测精度和其对应的在样本区间的预测值的二维数组 ,2, ,13,按(4)式计算IOWGA组合预测值,结果如下: <口”z1,>,(以2:,z血>,(口3。,动。>,,=1 125(430l 5 670(27‘2 5 470(20岛, z1一gL((口11,X11),<><口31,z31>)=6 7 987(2721 201(94。2 7 349(43岛,z2一gL(<口12,x12>,<><口32,z32>)=6 343(78‘8 582(75;z8 694(86如, (273=gL(,,<口33,勋3))一8 285(902l="" 9="" 800(33229="" 963(64‘3,="">口33,勋3))一8><口14,x14>,,<口34,z34>)=9
452(62‘l ll 042(40‘2 11 897(99。z5=gL( 3, 698(92;2 14 z6=gL(<口16,z16>,<口26,z26>,(口36,(2736>)一12 496(67‘12 534(98‘l 14 350(85‘2 207(87q, x7=gL((口17,(z17>,<口27,(2727>,<口37,(2737>)一14 16 966(19‘3, 261(83^16 x8==gL(<口18,x18>,<口28,x28>,<口38,z38>)=17 792(65。220 260(01‘3, 009(78‘l z9==gL(<口19,z19>, 19 991(4422 24 193(29‘3, 189(95f1 24 750(j沼22 28 890(19,3,主10=gL(<口1lo,x110>,<口210,(z210>,<口310,(27310>)=24 392(982l 29 520(8722 34 498(94‘3,zll=gL(<口1ll,(27111>,,<口311,z311))一29 41="" 478(91‘l="" 36="" 190(25;2="" 196(5823,z12="">口311,z311))一29><口112,z112>,)=35 385(81‘l 44 235(98‘z 49 194(50“。 X13一gL((口113,zll3>,(a213,x213),<口313,z313>)=44 其中,z。、,z、ls为3种预测方法在组合预测中的 为了反映本文提出的基于向量夹角余弦 IOWGA算子组合预测模型的有效性,按照的 IOWGA的加权系数,将其代人(9)式,整理得到 如下最优组合预测模型: 效果评价原则,选择以下列常规的误差指标作为 预测 max R(1l,Z2,z3)一(1 226(5511+ 衡量精度的评价指标体系: , 1 213(1212+l 210(2113), (1)误差平方和ES一?(五-3‘7,)2; t=l (34(82~,LTEL), (2)均方误差Em= fll+lz+Z3—1, 专雁i磊 1111?0,12?O,Z3>10。 (3)平均绝对误差‰一丙1 。蚤N}五一幺I;利用Matlab最优化工具箱,计算得到基于向 (4)平均绝对百分比误差,即 量夹角余弦的IOWGA算子组合预测模型的最 1曼 。 (zf优权系数为: 一(27r) XtE脚。丙2川 5 ZI一0(213 7,lz一0(208 6, 13—0(577 7。 (5)均方百分比误差,即 万方数据 第9期 周礼刚,等:基于向量夹角余弦的loWGA算子组合预测模型 1429 N f 余弦的IOwGA算子组合预测模型的各种误差 1 N指标值均明显低于其它单项预测方法的预测误 ?蚤?t一之肌 J差,表明本文提出的组合预测方法是有效的,并且 表2给出了各种预测方法预测效果评价结 也是合理的。 果。由表2可以看出,本文提出的基于向量夹角 表2各种预测方法预测效果评价结果 C w(The combination [3]Bischoff of macroeconomic forecasts 另外计算3种单项预测方法的预测值对数序 of [J](Journal Forecasting。1989,8(3):293—314( 列与指标的实际值对数序列之间的向量夹角余 [4]袁泉,何勇(组合预测方法在浙江省粮食产量预测中的 弦,得到: 应用[J](农业系统科学与综合研究,1996,12 320 166 002, 孕一0?999 153,琅一0?999 (4):246--248( 432 682。 [5]纪爱兵,孙建平,张艳娥(最优加权组合预测法在河北省卫 孕=0(999 生人力预测中的应用[J](数理医药学杂志,2003,13(1): 而基于向量夹角余弦的IOWGA算子的组 61—62( 合预测方法,得到的预测值对数序列与指标的实 [6]姜晨,徐宗昌,肖国军(用神经网络组合预测法估算反舰 际值对数序列之间的向量夹角余弦为 导弹研制费用[J](系统工程与电子技术,2004,26 594 呀一O(999 154。因为>max{协,琅,啦),所 (3):348—372( 以,由定义5可知,基于向量夹角余弦的IOWGA [7]滕云龙,师奕兵,康容雷(软件可靠性组合预测模型研究 [J](计算机应用,2008,28(12):3092--3094( 算子的组合预测方法为优性组合预测。 [8]唐小我,马永开。曾勇,等(现代组合预测和组合投资决策 4结束语 方法及应用研究[M](北京:科学出版社,2003:67— 125( [9]陈华友(组合预测方法有效性理论及其应用[M](北 京;科 本文将向量夹角余弦和IOWGA算子相结 学出版社,2008:1—182( 合,提出了一种基于向量夹角余弦的IOwGA算 [10]陈华友,盛昭瀚(一类基于lOwGA算子的组合预测新 方 法[J](管理工程学报,2005。19(4):36—39( 子最优组合预测模型,并定义了优性组合预测、非 劣性组合 ordered avera—ZS,DaQLThe1-11]Xu geometric weighted 预测等概念,通过对税收收入进行组合of ging operators[J](International Journal Intelligent 预测说明了该组合预测方法是有效的和合理的, Systems,2002,17:709—716( 且该模型存在优性组合预测。 [12]陈华友,盛昭瀚,刘春林(基于向量夹角余弦的组合预测模 型的性质研究[J](管理科学学报,2006,9(2):l一8( [13]张洪涛,朱卫东(安徽省高新技术人才需求的灰预测及灰 [参考文献] 色关联度研究[J](合肥工业大学学报:自然科学版,2007, 30((2):222--225( Wof J J(Combination forecasts[J] ( CE1]Bates M,Granger [14]常青,刘强(基于支持向量机的税收预测模型的研究 ResearchOperations Quarterly,1969,20(4):451--468( [J](计算机工程与设计,2007,28(7):1653—1654( of latent R J T(Collinearity the B,Clemenanduse[2]Guerard root for GNP ofregression combining forecastsFJ](Journal (责任编辑张淑艳)Forecasting,1989,8(3):231--238( 万方数据 向量夹角余弦的水文组合预报方法分析 李桂钦 广东省水文局梅州水文分 局514000 摘要:本文主要针对在进行水温预报过程中,模型预报还缺乏一定的精准性,并 且提出了建立在向量夹角余弦的基础上的组合预报法。该种方法所采用的理论则 是组合预测,并且以此建立了权值向量、实测向量以及预报向量三种类型的向量 值,并且借此形成了向量模型(夹角余弦)。并且按照相关的预算步骤进行了简 单的实验,希望可供同行朋友借鉴参考。 关键词:水文组合 向量夹角 余弦 预报实验 中图分类号:P331 文献标识码: A 文章编号: 一、 水文组合预报的几种方法 (一)向量夹角余弦模型 假设在 q 集合中纯在有水文预报模型数量 m 个,并且在水文系统中,每一次 相间隔的预报之间所间隔的时间为 T,并且在 nT 时间范围内,存在一个断面在 时刻以后,更具时间顺序所测量的数据值如下所示:, ,; 按 顺 序 第 i 个 水 文 模 型 在 相 对 应 的 时 间 内 其 得 到 的 预 测 值 为 ,,。其中 i 的取值为 1~m,其权值为,, 代表的是取值个数为 m 的水位预报对应的加权系数(组合),并且满足等式关系: ,其中 i 的取值依然为 1~m,按照相关的预测理论,建立 在个数为 m 的水文模型上的组合预报相应的结果可以通过下式进行表示: , ,,并且纯在等式 ,并且丨 Q 丨 =m 则是被看作是整个组合实际的长度。如果我们通过向量的方式对其进行阐述, 那么上面所获得的信息就可以进行这样的表示: ,X 表 示为实测向量,并且按照顺序在第 i 个的预报向量, 其权值向量 W=,其组合向量 ,在上 面的式子中,向量长度通过 n 表示,并且按照向量(A 和 B)相互之间的夹角余 弦定理,我们可以进行如下的表示: ,并且可以将相应的 水文预报以及组合预报两个向量指尖的夹角余弦进行如下的表示: 。 因为上文的 X 是一个实测的数据,而 Yi 则是水文预报的一项结果,再进行 水文预报(组合)以前,已经是一个已知的数据。所以 也仅仅是权值向量函 数中的一个,我们将其标记为: ,显而易见的,在规定的 nT 时间段内,如果组合预报向量与实测向量之间的数值越接近,那么就代表组合预 报向量与实测向量之间的夹角就更加的小,而 也更加的倾向 与余弦最大的一个数值——1,所以,再进行水文预报的过程中,只能尽量的将 nT 进行最大化考虑: 。 (二)可变权值计算法 为了能够使得水文预报系统的 S 能够完全的满足(a)的条件,所以在进行 组合以前,必须对整个 Q 集合进行每一个水文预报模型的筛选,同时应该更具不 同的理论模型以及相应的预报方案,进行水文预报工作的开展。同时对于每一个 模型之间所存在的相关性进行一定程度的降低但是,因为所有的水文现象都基本 上存在一定的联系性,所以这种无关特征的线性并不能对模型筛选过程进行任何 的保障。 二、实验验证 某流域属干旱半干旱地区、 大陆性气候, 年均温 6-13 ? C, 年降水量 3500-800mm,年蒸发量 1000-2000mm,年平均流量 0.32km/s,实测最大洪峰流量 33 为 7.66km/s(预报时采用组合长度 m的单项水文预报模型集合 Q={XAJ,BP,VD), 3分别表示新安江模型、BP 神经网络模型和模糊决策模型,流量单位为 km/s,时 间单位为 h(在预报许可误差为实测值 20%的条件下,XAJ、BP、VD 三种模型在 各断面的确定性系数 DC 均超过 0.48,受流域低精度气象、地形、地貌数据以及 历史资料不足的影响,各模型的预报合格率 QR 不高,有的甚至未超过 50%,属 于不合格预报(给定组合长度 n=5,时间间隔=2h( 图 1:概化示意图 其中 A 断面具有丰富的历史资料,B 断面历史资料相对比较匮乏,当 A 断面 在时间段的时候,所进行测量并且得到的 5 个连续 的 值 ( 实 测 值 ), 并 且 相 互 构 成 的 向 量 x 如 下 所 示 : ,并且,每一个单独的水文预报的向量如下所示: , Y、 2 Y=,并且通过对其相关性进行判断,我 3 们可以发现,Y2、Y1 以及 Y3 之间的线性并不存在任何的关系,并且因为 P=1 的 原因,所以必须选取时间跨度为 的洪水,最终结果为测量到的数据一共为 488 条,通过相关的计算,我们可以将 实际的权重值大小计算得出,其中初始的权重值大小为[0.558,0.362,0.08],并 且可以通过推导公式将后面的权重进行推导计算。 针对 B 断面而言,我们给定 m=n=3.并且进行 t= 进行预报。 0 在这个时间段内,其预报值分别是 0.795,1.203 以及 1.951.我们选取在 t0 以前 最近的 n 个历史向量(实测)进行导入:,并且同时 通过 Q 使得每一个预报模型进行预报以后的历史水文预报 Yt(λ,λE)分别为 s下面的:Y1= , 以及,与此 同时,三个之间的线性相互无关,所以对广义 moore oenrose 进行计算,以及 F 分别为: 2因为 w := f +f t+f t+ -+f 计算得权值向量 Wt' =[4.177,2.538,-6.895], t i0 il i2 iktk 0 归一化后为:Wt'o=[o(540,o(460,o],使用该权值对 t0 进行水文组合预报 得玩。-1.015(对照实测数据的绝对误差为 0.070,小于各单项水文预报的误差 0.258,0.150,1.006;且通过历史数据及 t时刻数据构成的向量,经计算后 XAJ, o BP,VD 三种模型的向量夹角余弦分别为 0.973,0.997,0.954,小于水文组合预 报的向量夹角余弦 0.998,可见水文组合预报模型比 Q 中任意单项模型均具有更 高精度( (二)精度分析 为了分析本文水文组合预报方法的精度,我们在时段[2010-8-1200: 00:00,2010-10-1700:00:001]内,对 A、C 两个断面进行了精度分析,共计生成实时 60 条(图 2 为 p=l 的 A 断面 单项水文预报结果 180 条、实时水文组合预报结果 XAJ、 BP、 VD 三种模型预报结果、 实测结果以及水文组合预报模型 (HCF: Hydro-logical Combined Forecasting Model)结果。 图 3 为 p=0 的 C 断面 XAJ,BP,VD 三种模型预报结果、实测结果以及 HCF 结果,由于资料匮乏,该断面三种单项水文预报模型以及水文组合预报的合格率 QR 均很低,在 20%时为 30.O%,35.O%,23.3%,57.O%,在 30%时,则为 40(O%, 45.0%,30.O%,63.O%,总体上水文组合预报的 QR 大于各单项水文预报的 1.40 倍,增幅超过 27%,精度提升明显( 图 2:当 P=1 的时候每一个模型精度对比结果 图 3:当 P=0 的时候每一个模型精度对比结果 三、结束语 本文主要建立在向量模型(夹角余弦)基础上,提出了两种可以有效的满足 水文预报(组合)条件的权值获取办法,并且经过了实际实验的验证,对向量的 长度、历史资料情况、精度以及组合长度针对水文组合预报所造成的影响进行了 详细的分析,同时通过多个水文预报模型几种有效的组合类型,将系统的精度实 现了有效的提高,而下一步工作中,最主要的就是:(1)通过动态逼近法对权值 进行科学的计算,并且所进行限定的向量长度和组合长度的大小必须保持一致, 因为对于流域而言,其使用的数量 m 相对比较有限,所以导致实验过程以及实际 操作过程中,只能够通过少量真是数据的导入结合历史塑聚进行计算,这就使得 水文预报本身的精度实际振幅大小受到一定的降低,此时必须对模型进行一定的 优化;(2)更进一步的对马式京根法进行结合,同时还需要对 RS 带来的地形以 及地貌数据进行有效的结合,从而使得整个预报的精度得到提升。 参考文献: [1].刘宇 韩锐恒 于爽.两参数月水量平衡模型在尼尔基水库月径流量预测中的 应用[J].东北水利水电,2012(6):153-155. [2].张静 朱秀丽 庞继高.泰安抽水蓄能电站下水库大河水库水文预报调度工作 研究[J].水利科技与经济,2012,18(9):164-166. 第 20卷 第 2期重庆工学院学报2006年 2月 Vo l. 20 No. 2 Jou rna l of Chongq ing In stitu te of Techno logy Feb. 2006 【计算机与自动化 】 3 基于自相关夹角余弦值的语音端点检测 黄仁 ,黄苏园 ,柳 刚 ()重庆大学 计算机学院 ,重庆 4 00044 摘要 :在基于高维空间和自相关函数的基础上 ,提出了一种语音端点检测的新方法 ———基于短时 自相关夹角余弦值的语音边界检测法 . 阐述了该方法实现的原理 ,并在 MA TLAB 环境下进行仿真 实验测试 . 关 键 词 :高维空间 ;端点检测 ;自相关夹角 ;低信噪比 ( ) 中图分类号 : TP391. 42 文献标识码 : A 文章编号 : 1671 - 0924 2006 02 - 0078 - 04 Speech En dpo in t D e tec t ion Ba sed on A u to2C orre la ted C orn er C o s in e HUAN G R eng, HUAN G Su2yuan, L IU Gang ( )Co llege of Comp u te r Sc ience , Chongq ing U n ive rsity, Chongq ing 400044 , Ch ina A b stra c t:O n the ba sis of h ighe r2d im en sion sp ace and au to2co rre la ted func tion s, th is p ap e r p re sen ts a new m e thod of end po in t de tec tion of sp eech, a c ro ss ze ro sp eech recogn ition m e thod ba sed on sho rt2 tim e au to2co rre la ted co rne r co sine, d iscu sse s the p rinc ip le s of rea lizing th is m e thod, and ca rrie s ou t sim u la tion exp e rim en ts unde r MA TLAB environm en t. Keyword s: sp ace of h ighe r d im en sion; endpo in t de tec tion; au to2Co rre la ted of co rne r; low SNR 小的情况下性能会有较大的下降 , 而且有的方 0 引言 计算复杂度太高 ,在实时系统中不适用. 在这里提出一种基于相关性和高维空间向 在语音识别中 , 如何有效地进行端点 检测 对 的自相关夹角的端点检测方法. 这种方法计算 语音识别的准确性和降低语音识别处理中的计算 杂度较低 ,实现简单 ,在信噪比为 - 2 db 的情况 量和处理时间都有很重要的作用 . 仍然能够取得很好的效果 . 目前已有不少端点检测的算法 , 其中 最普 遍 [ 1 ] 的是由 R ab ine r 提 出 的 基 于 能 量 和 短 时 过 零 [ 2 ]率 的端点检测算法 . 在干净无噪的环境下 ,基于 1 自相关夹角问题的分析方法 能量的端点检测算法具有计算量小并能准确检测 1. 1 方法的提出到端点的优点 . 但在噪声环境下 ,这种算法不具备 抗噪性能 . 有很多人也提出一些新的端点检测算 对于 2 个语音信号 , 若它们具有相同的自 [ 3 - 7 ] () 关函数 或具有一定比值 ,则这 2 个语音信号 法和参数来检测 语音 端 点 , 但 是 在信 噪比 较 3 收稿日期 : 2005 - 11 - 28 ( ) 作者简介 :黄仁 1962 - ,男 ,四川成都人 ,硕士 ,副教授 ,主要从事模式识别 、知识工程研究 . () μβ功率谱结构是相同 或相似 的 ,即这 2 个语音信 决于 ,和 h / p 的值 . 其中第 1 项近似于信噪比 ( )( μ)号有很强的相似性 . 把一帧自相关函数序列看作 的平方 , 记为 ; 第 2项取决于 Rl与 Rl的相 s w β高维空间中的一个矢量 , 则自相关夹角就是 2 个 似程度 , 记为 , 第 3 项取决于信号自身的噪声与 语音信号的自相关序列矢量的夹角 , 取其余弦值 噪声模型的近似程度 , 一段语音信号的 h / p 值基 本趋于 一 个 常 数. 所 以 在 信 噪 比 一 定 的 情 况 下 作为检测的特征参数. 对于相似信号和不相似信 αβ 号 ,余弦值将趋于不同的值 .co s取决于信号与噪声相似的程度 . β对 , 若被 测 信 号 是 噪 声 , 则 相 似 度 趋 于 1, 1. 2 自相关夹角的定义 αco s向 1趋近 , 被测语音与噪声模型相一致 ; 若是 把每帧 语 音 信 号 看 作 高 维 空 间 中 的 一 个 矢 βαα () 语音信号 ,ν 1, co s向 0 趋近. 所以可使用 co s量 , 它的自相关函数序列 假设共取 m 个值点 看 作为端点检测的参数. 作是这个矢量在高维空间中的坐标 , 每个自相关 函数值表示这个矢量的系数. 定义这 2 个矢量的 ( ( ) ) ?Rk Rk 2 具体实现 w y k α 自相关夹角余弦 : co s= ( ) ( ) | Rk | | Rk | w y 2. 1 预处理 1. 3 运用自相关夹角来检测语音 取纯净语音“大家好 ”作为端点检测的语音信 1. 3. 1 建立噪声模型. 取一段纯噪声作为参考信 号 ,长 度 为 1. 24 s, 用 MA TLAB 进 行 仿 真. 按 12 ( ) ( ) 号 xn = w n , 分帧后对每帧建立其自相关序 1 kH z和 12 b it进行采样量化 . 窗函数使用哈明窗 , ( ) ()列 Rk , w 表示噪声 , t 计帧数为 T 表示帧的序 w t 取窗函 数 的 长 度 N 为 360 点 , 帧 移 为 100, 共 60 列号 , k 表示自相关函数的帧延迟. 求出所有的自 帧 . 噪声取为白噪声 , 带噪语音由纯净的语音和噪 1 ( ) 相关 函 数 序 列 后 , 对 其 求 平 均 Rk = ?R w w tt T 声按不同的信噪比叠加而成 . ( ) k , 得到噪声模型的自相关函数值序列 . 2. 2 运用自相关夹角进行端点检测 1. 3. 2 进行端点检测. 把一段实际语音看成2 种 2. 2. 1 建立噪声模型 . 使用典型的白噪声建立噪 [ 8 ] 状态 :状态 1 和状态 2. 状态 1 只有噪声 y ( )()n 声模型 . 根据信噪比 这里取为 2 db的要求 ,设计 1 [ 11 - 12 , 14 ] ( ( ) ) ) ( ( ) = v n ; 状态 2 为语音 , yn = s n + v n , 其,取其前 20 帧 , 对每出需要的白噪声信号 2 ( )( ) 中 : v n 为噪声 ; s n 为语音信号.帧建立 它 的 自 相 关 函 数 序 列 然 后 , 对 其 求 平 均 ( ) 当被测语音为状态 1 的语音信号时 Rk =1y ( ) ( ) = ?Rk , 得到噪声模型的自相关函数R k w t w t 20 ( ( ( ) ) )( ) Rk Rk 是 v n 的短时自相关函数 , 此时这v v 值序列 . 2 个信号有很强的相似性 , 它们的功率谱相同或相 [ 8 - 9 ] 2. 2. 2 端 点 检 测. 按 照 建 立 噪 声 模 型 相 同 的 方 ( ) ( ) α, 所以有 R k = hR k co s趋于 1. 当被 似 v w 法 , 对语音信号的每帧 , 计算其自相关函数序列 , ( ) ( ) 测语音为状态 2 的语音信号时 Rk = Rk + R y s v [ 8, 10 ] 再计算每帧的自相关夹角 . 使用双门限检测方法 ( ( )) ) ( ( ) k . Rk 是 s n 的自相关函数 R k = R s s0 s α检测端点. 根据 co s来确定阈值 . ( ) ( ) ( ) ( ) ( ) k + hRk , Rk 和 Rk 正交 ; Rk = pR w s0 w v w 图 1 是纯净 的 语 音 信 号 , 图 2 是 信 噪 比 为 22 2 2 2 ( ) ( ) ( ) ( ) k , ?Rk = ?Rk - h?Rk , 所以可表 s0 s w k k k db的带噪语音信号 , 图 3 是对应的带噪语音的自 ( ( ( )( ) ) ) 示为 Rk = Rk + hRk + pRk , y s0 w w 相关夹角的幅值图形 , 图 4 是使用短时能量检测 ( ) ?RRk w y k 语音的幅值图形 . α = co s= ( ) ( ) | Rk | | Rk | w y 可以看到在信噪比为 2 db 时 , 使用短时能量 1 有些语音已经不容易检测出来 , 如“大 ”和“好 ”, 2 2 2 2 ( ) ( ) ( ) ?Rk [ 1 - h?Rk / ?Rk ] s w s 失误较大 ; 而使用短时自相关夹角 , 却仍然能有较 k k k ?+ 1 2 2 2 ( )( ) 1 + h / p p ?Rk 好的分辨效果 . v k 可以把通过手工检测到的语音信号的端点与 1 α α记 co s= , 可 见 co s取 使用自相关夹角 、短时能量检测到的端点进行比 ( β)1 - μ+ 1 ? 2( ( ) 较 . 使 用 手工 方法 判 断出 其起 末点 帧 数为 15 , 1 + h / k 重 庆 工 学 院 学 报80 表 1 不同信噪比时的参数 ) 23, 26,35, 44 ,55 . 表 一 列 出 了 不 同 的 信 噪 比 时 , 使用自相关夹角和短时能量检测到的语音始 信噪比短时能量自相关夹角 末点帧数 . ( () () )db 帧数 帧数 16 27 45 16 26 45 6 23 36 56 23 35 56 17 27 45 16 26 45 4 23 36 56 22 26 56 27 43 17 27 45 2 36 57 23 36 57 27 40 17 27 45 0 37 57 23 37 57 24 40 17 27 45 - 2 37 52 24 37 57 27 23 46 - 4 36 37 58 可以看到在信噪比为- 2 db 的情况下 ,仍 较好的检测到语音 . 当信噪比为 - 4 db 时 ,第一 语音“大 ”不能检测到 ,而且“好 ”的末点检测有 大失误 . 3 实验结果 3. 1 数据库和噪声 采用 12 kH z的采样频率 , 12 b it量化 ,在安 [ 11 - 12 ] 的环境下对语音信号进行采集 . 语音样本 (别由独立的声韵母和 2 组语句 每组 10 个句子 组成 . 由一对青年男女以不同的语气 、语速多次 读 . 以此结果并以此作为测试集的纯净语音的 本 . 在此基础上对语音的起点和终点进行标注 为衡量标准. 噪音采用国际通用的 NO ISEX - 92 噪声数据包中的白噪声 W h ite. 分别取在信噪比 6 db、4 db、2 db、0 db、- 2 db、- 4 db 的时候进 检测 . 可以看到在低信噪比下自相关夹角的方 仍然能够取得较好的效果 ,而短时能量效果较差 识别结果见表 2. [ J ]. R ESEARCH & PRO GR ESS O F SOL IA STA TE E2 表 2 2种识别方法在不同信噪比下的识别率 单位 : % ( ) L ECTRON ICS, 1994, 2 : 146. 识别方法6 db 4 db 2 db 0 db - 2 db - 4 db H uang J , Zhao Y X. A DCT2ba sed fa st signa l sub sp ace [ 4 ] techn ique fo r robu st sp eech recogn ition [ J ]. IEEE 自相关夹角95. 1 92 90. 2 86. 8 79 71. 4 ( ) Tran s Sp eech and A ud io P roce ssing, 2000, 8 11 : 短时能量 747 - 751. 90. 2 81. 5 71. 6 64. 1 56. 9 48. 1 贾川 ,张健 ,陈振标 ,等 . 噪声环境下的端点检测算法 [ 5 ] 3. 2 结论 ( ) 研究 [ J ]. 电声技术 , 2004, 5 : 51 - 54. 低信噪比情况下的语音信号端点检测一直是 [ 6 ] L aw rence R ab ine r, B iing2Hwang J uang. 语音识别基本 一个难点 ,这里提出的基于自相关夹角的端点检 () 原理 影印版 [M ]. 北京 :清华大学出版社 , 1999. 25 测 ,能较好的解决这一问题 . - 60. 使用这一方法进行检测 , 阈值的选取 是个 关陈四根 . 基于熵函数的语音端点检测方法 [ J ]. 声学 [ 7 ] ( ) 与电子工程 , 2001 , 61 1 : 48. 键问题 ,不合理的阈值也造成端点检测的失误. 而 张玲华 ,郑宝玉 . 随机信号处理 [M ]. 北京 :清华大学 [ 8 ] 且在低于 - 2 db 的情况下 ,端点检测效果就不是 出版社 , 2003. 38 - 57. 很好. 同时需要注意的是有些清音的谱结构和噪 [ 9 ] 刘利秋 . 相关分析技术在工程测量中的应用分析与声信号的谱结构相似 , 这就会给端点检测带来一 ( ) 研究 [ J ]. 沈阳航空工业学院学报 , 2004 , 21 5 : 66.些失误 ,此时可以通过其他的一些参数来检测清 [ 10 ] 王炳锡 . 语音编码 [M ]. 西安 :西安电子科技大学出 [ 13 - 14 ] 音 ,比如使用过 零率 等 , 这些 都 将是 以后 需 版社 , 2002. 14 - 62. 要改进的地方 . Shen J L , H ung J W , L ee L S. Robu st en trop y2ba sed [ 11 ] endpo in t de tec tion fo r sp eech recogn ition in no isy envi2 参考文献 :ronm en ts [ A ]. ICSP 1998 [ C ]. Sydney, A u stra lia: [ s. n. ] , 1998. 232 - 235. [ 1 ] W ilpon J G , R ab ine r L R , M a rtin T. A n Imp roved J unqua J C. A robu st a lgo rithm fo r wo rd bounda ry de2 [ 12 ] W o rd2 D e tec tion A lgo rithm fo r Te lep hone2 Q ua l 2 ity tec tion in the p re sence of no ise [ J ]. IEEE Tran s on ( ) Sp eech and A ud io P roce ssing, 1996, 2 3 : 406 - 412. Sp eech Inco rpo ra ting bo th Syn tac tic and Sem an tic Con stra in ts [ A ] . A T &T B e ll L ab Tech. J [ C ]. N ew 胡广书 . 数字信号处理 —理论 、算法与实现 [M ]. 北 [ 13 ] 京 :清华大学出版社 , 1997. 5 - 30.Yo rk: [ s. n. ] , 1984. J unqua J C, R eave s B , M ak B. A study of Endpo in t Tucke r R. Vo ice ac tivity d ic tion u sing a p e riod ic ity [ 2 ] [ 14 ] D e tec tion A lgo rithm s in A dve rse Cond ition s : In2 c i2 m ea su re. P roc. In st [ J ]. E lec t. Eng, 1992, 139: 377 - 380. dence on a D TW and HMM recogn ize [ A ] . P roc , Eu2 ro sp eech [ C ] . Genova Ita ly : In te rna tiona l re sea rch confe rence, 1991. 1371 - 1374. ()责任编辑 刘 舸 [ 3 ] Chen Zhengm ing. Comp u te r2Con tro lled P la sm a E tch ing and endpo in t de tec tion in the GaA s D evice s P roce ssing 余弦夹角法进行分类 1, 夹角余弦距离计算公式 X T X i S (X , X i ) =cos θ= X i 2, 计算步骤 3, 程序 clear all; loadtemplet; sample=(pattern(3).feature(:,3))'; d=0; dmax=[-inf,0]; for i=1:10 for j=1:pattern(i).num d=(pattern(i).feature(:,j)'*sample')/(sqrt(sum(pattern(i).feature(:,j).^2)... *sqrt(sum(sample.^2)))); ifdmax(1)<> dmax(1)=d; dmax(2)=i-1; end end end dmax(2) 4, 二值化的夹角余弦距离分类 ? 1. 先将样本库中的样本进行二值化处理,阀值取T=0.05。 ? 2. 应用夹角余弦法对样品进行分类。 1) 程序 clear all; load templet pattern; % figure; plotchar(pattern(1).feature(:,10)); plotchar(pattern(2).feature(:,10)); plotchar(pattern(3).feature(:,10)); sample=pattern(3).feature(:,10)'; for i=1:25 if sample(i)>0.05 simple(i)=1; else sample(i)=0; end end for i=1:10 for j=1:pattern(i).num for k=1:25 if pattern(i).feature(k,j)>0.05 pattern(i).feature(k,j)=1; else pattern(i).feature(k,j)=0; end end end end d=0; dmax=[-inf,0]; for i=1:10 for j=1:pattern(i).num d=(pattern(i).feature(:,j)‘*sample’)/(sqrt(sum… (pattern(i).feature(:,j).^2))*sqrt(sum(sample.^2))); ifdmax(1)<> dmax(1)=d; dmax(2)=i-1; end end end y=dmax(2) 5, 二值化的Tanimoto 测度分类 距离公式 X T X i S (X , X i ) =T T X X +X i X i -X T X i 6, 结果显示 转载请注明出处范文大全网 » 向量的距离与夹角余弦向量夹角余弦的水文组合预报方法分析
基于自相关夹角余弦值的语音端点检测
余弦夹角法进行分类