范文一:相关系数的定义公式为: - 中国台州
相关系数的定义公式为:
,(x,x)(y-y)
r,
22 ,(x-x),,(y,y)
n,xy,,x,y
r,
2222 或化简为:n,x,(,x),n,y,(,y)
表1 2005年-2010年台州农村人口与新农村建设相关指标
年份 2005 2006 2007 2008 2009 2010 指标
第一产业就业人数(万人) 103.04 100.65 87.83 83.00 77.37 75.17 人均受教育年限(年) 7.44 7.53 7.61 7.72 7.81 7.88 城市化水平(%) 50.13 51.37 52.56 53.45 54.33 55.54 人均生产总值(元) 22395 25940 30247 34041 35408 41777 农民人均纯收入(元) 6689 7368 8331 9180 10006 11307 人均住房面积(平方米) 49.6 52.3 54.4 55 56.3 57 居民恩格尔系数(%) 37.7 35.5 34.6 36.4 36 36.9 人均文教娱乐支出(元) 777 762 798 778 850 854 农村自来水普及率(%) 79.7 79.8 83.1 82.6 87.4 88 资料来源:2010年台州市人口普查和2011年《台州统计年鉴》
表2 2005年-2010年台州农村人均指标的相关系数
自变量 第一产业就业人数 人均受教育年限 城市化水平 因变量
人均生产总值 -0.9660 0.9866 0.9940 农民人均纯收入 -0.9681 0.9961 0.9938 人均住房面积 -0.9664 0.9578 0.9763 居民恩格尔系数 0.0875 -0.0134 -0.0813 人均文教娱乐支出 -0.8393 0.8659 0.8324 农村自来水普及率 -0.9449 0.9560 0.9396
表3 台州农村就业人口的产业结构
单位:%
年份 产业 第一产业 第二产业 第三产业
2000年 33.4 43.7 22.9
2010年 16.2 55.6 28.2 资料来源:2010年台州市人口普查
范文二:【精品】相关系数矩阵 的特征方程为 ,35
10.60.4,,
,,32相关系数矩阵 的特征方程为 , ,,3,,1.84,,0.224,00.610.8,,
,,0.40.81,,
解这个特征方程,可得到它的特征值为
,,0.16242348075,,2.21493471650,,,0.62264180275,。 312
与这3个特征值对应的特征向量为
u0.505785207u0.824037731u0.255231546,,,,,,,,,,,,111213,,,,,,,,,,,,u,0.634577460u,,0.154978930u,,0.757161131,,。 212223,,,,,,,,,,,,
,,,,,,,,,,,,u0.584373828u,0.544925086u0.601301821313233,,,,,,,,,,,,
X,X,X设所要研究的3项指标,作中心化标准化处理后,对应于3个变量 。 123
X,X,X,,由于第3个特征值很小,可以认为 ?,所以,可以找到3个变量 012333
之间的一个近似关系:
uX,uX,uX?, 0131232333
即
0.255231546X,0.757161131X,0.601301821X?, 0123
X,3.0X,2.4X? 。 0123
X,X,X 还可以用图示的方法表示3个变量 之间的关系: 123
在直角坐标系中,用 , 作为向量终点的坐标,作3个向i,1,2,3(u,,u,)i11i22
X,X,X量,分别代表变量 。图中向量之间夹角的余弦,就是它们的相关系数。向量123
方向相同,表示变量正相关;向量方向相反,表示变量负相关;向量方向互相垂直,表示变量不相关。
XX 从图中可以看出,3个变量之间的关系,都近于正相关,与的关系特别密切, 32
X,XXXX与的关系不是那么密切,其中与的关系,比与的关系相对密切一些。 23312
范文三:相关系数统计量的功能及其应用探讨_以SPSS为分析工具
相关系数统计量的功能及其应用探讨_以SPSS为分析工
具
第11期(总第110 期)2008 年11 月No. 11
(Series No. 110)
Nov 2008
统计教育Statistical Thinktank
1 相关系数统计量的功能探讨1.1 简单相关系数统计量的功能探讨 含义由样本观测值yi,x1i,x2i,L,xki i=1,2,L,n,可以分别计算y 与xli 以及xli (l=1,2,L,k)与xji (j=1,2,L,k)之间的简单相关系数rlj。rxy= COV (x,y)σxσy
功能通过样本简单相关系数,不仅可以观察因变量y
与每个自变量xj 的相关系数ryi (即因变量y 与每个自变量xj 的线性相关程度)的大小,而且还可以观察自变量xli 与xji 之间的相关系数rlj (即自变量xli 与xji 之间的线性相关程度)的大小。 计算机实现简单相关系数统计量r 的计算可以利用Excel、Eviews、马克威、SPSS 等傻瓜软件完成。其中,SPSS的操作步骤为:首先运行SPSS;其次建立SPSS数据文件;第三步,在数据窗口,点选Analyze/Correlate/Bivariate,进入Bivariate Correlations 对话框,将变量选移到Vari,ables栏内,点选Pearson(皮尔逊相关
系数)、Two-tail
(对相关系数作双侧检验),点击OK,即可得到简单相关系数。
以表1资料为例,计算的简单相关系数统计量如输出结果1所示。1.2
复相关系数统计量的功能探讨 含义作者简介:宋廷山,1962年生,
山东经济学院教授,硕士生导师。研究方向:经济计量分析与综合评
价。Discussions on the Functions of the Statistics of Correlation Coefficient and its Applications:
Taking SPSS as Analysis Tool
Song Tingshan
Abstract: Correlation coefficient can be catalogued into simple correlation coefficient, multiple correlation coefficient
and partial correlation coefficient. Their meanings, functions, applications and the computer operations are different
from each another. Although the calculation of statistics of correlation coefficient can be executed by different software,
yet from the simplicity of operation and the explanatory of results, such fool software as SPSS, MARKWAY should be
the best choice. When choosing the impact factors of variation, it's advocated that partial correlation is used,
rather than
simple correlation.
Key Words: Correlation coefficient; Statistics; Function; execution of computer operation; application; discuss
相关系数统计量的功能及其应用探讨―――以SPSS 为分析工具
宋廷山摘要:相关系数分为简单相关系数、复相关系数和偏相关系数,
他们的含义、功能、应用和计算机的实现操作各
范文四:以互信息为基础的广义相关系数
第34卷第3期2002年5月
四川大学学报(工程科学版)
JOURNAL OF SIC H UAN UNIVERSI TY (ENGINEERING SCIENCE EDITI ON)
Vol. 34No. 3May 2002
文章编号:1009 3087(2002) 03 0001 05
以互信息为基础的广义相关系数
丁 晶1, 王文圣1, 赵永龙2
(1. 四川大学水电学院, 四川成都610065; 2. 四川省电力调度局, 四川成都610016)
摘 要:提出了描述变量间包括线性和非线性的相关程度的一种以互信息为基础的广义相关系数指标R g , 给出三种算法:等间距法、等概率法和等概率递推法。等概率法计算出的结果与序列的总体概率分布无关, 分组较为客观、合理, 计算简便, 较其他算法更优越。在等概率法基础上, 通过统计实验途径, 得到了广义相关系数分位数表。关键词:非线性; 广义相关系数; 互信息中图分类号:TP274
文献标识码:A
General Correlation Coefficient Between Variables Based on Mutual In formation
DING Jing 1, WANG Wen sheng 1, Z HAO Yong long 2
(1.School of Hydraulic Eng. , Sichuan Uni v. , Chengdu 610065, Chi na; 2. Sichuan Elec tric Bureau, Chengdu 610016, Chi na)
Abstract:The correlation between variables is of importance in the analysis of nonlinear dynamic system. Ho wever tradi tional approaches are usually centered on the analysis of autocorrelation coefficient and mutual correlation coefficient or other indexes that only reflect the linear correlation between variables. Obviously it is not sufficient for the real system that often has nonlinear correlation structure. Mutual information is used in such analysis. A general c orrelation c oeffi cient is proposed and three different algorithms:equidistance algorithm, equal probability algorithm and successively e qual probability algorithm, are discussed. The equal probability algorithm, which has no relationship with the studied population distribution, is the best and simplest. A quantile table of general correlation coefficient based on the equal probability algorithm is provided for statistic test purpose.
Key words:nonlinear; general correlation coefficient; mutual information
在实际分析计算工作中, 常常需要研究变量间的相关性。如何正确分析变量的相关性, 将直接影响分析计算结果的优劣。变量间是否真正具有相关性, 相关程度多大, 是线性的还是非线性的? 正确回答诸如此类的问题, 在非线性动力系统分析中是很重要的。
传统分析方法中, 常用互相关函数来表征两个变量间的相关程度, 用自相关函数来表征变量X 中
收稿日期:2001 11 18
基金项目:国家自然科学基金重大资助项目(50099620)作者简介:丁 晶(1935 ) , 男, 博士生导师. 研究方向:水文水资源.
x t 与x t +k 间的相关程度, 其中k 为滞时。此外还有与上述分析互为傅里叶正、逆变换的互谱分析和谱分析法
[1]
。这些方法虽然在计算上简单易行, 但存在着
一个很突出的问题:它们仅能反映变量间的线性相关程度, 而所研究的问题, 往往具有非线性结构, 因而如何从非线性角度来度量变量间的相关性, 显得更为重要。反映变量间广义相关程度的互信息函数的提出, 成功地解决了这一难题。
1 互信息原理与广义相关系数
根据信息论原理[2, 3], 离散型随机变量X 的不(:
2
H (X ) =-
四川大学学报(工程科学版)
q
第34卷
i=1
P (x i ) lg P (x i ) (1)
当X 和Y 完全相关时, I (X , Y) =H (X ) =H (Y) , R g =1; 当X 和Y 完全独立时, I (X , Y) =0, R g =0; 在一般情况下, R g 介于0与1之间。不过R g 不可能为负值, 无法区分正相关和负相关。类似于线性相关函数, 亦可以在广义相关函数中引入阶数、自相关、互相关等概念。
式中, P(x i ) 为发生事件x i 的概率; q 为可能发生的
事件(状态) 总数。显然, 对于完全确定的变量X , H (X ) =0; 对于随机变量X , H (X ) >0(非负性) , 且H (X ) 的值随状态数q 的增加而增大(递增性) 。对于两个不同的随机变量X 和Y, 可定义X 对于Y 的条件信息熵H (X |Y) 为:H (X|Y) =-
2 互信息及广义相关系数的算法
2. 1 算法概述
由上面的分析可以看出, 求广义相关系数R g , 实际上是求变量中事件的个数, 以及事件的概率和条件概率。在实际分析中, 常用到的方法是计盒法。其基本思想是:将变量X 和Y 组成的样本空间化成若干! 盒子?、! 网格?或分成若干! 组?(这对应于变量中不同事件或状态) , 然后通过统计各盒中的点数来求出其概率值。
按划分盒子的方法, 可将计算互信息及广义相关系数的算法分成三类。
2. 1. 1 等间距算法
文献[5, 6, 7]最早将其应用于互信息算法中。这种方法是将变量X 和Y 组成的样本空间分别按X 和Y 组成的可能状况值等间隔地划分若干组。显然, 落入各个盒中的样本点数将与变量X 和Y 的概率分布有很大关系, 这也就是说, 在相关程度相同的情况下, 例如都为完全独立的, 随机变量总体分布不同, 按这种方法求出的广义相关系数R g 将是不同的。表1中按此方法分别计算了10000个总体服从正态分布(均值EX =100, 方差s =1. 0) 和10000个总体服从 分布(均值EX =100, 方差s =1. 0, 偏态系数分别为Cs =1. 0, Cs =2. 0) 的完全独立序列的一阶广义相关系数R g 在不同样本容量n 下的平均值。其中, nb 为划分的网格数。
表1 不同条件下的广义相关系数均值
Tab. 1 The average of general correlation coefficients in
different conditions
样本容量n 网格划分nb 30405060801002003004005008008#89#99#910#1011#1112#1216#1619#1921#2123#2328#28正态分布0. 38190. 34890. 29240. 28520. 25170. 23160. 18220. 15870. 14020. 12960. 1104 分布Cs =1. 00. 35600. 32270. 27040. 26200. 23090. 21160. 16450. 14320. 12590. 11660. 0983Cs =2. 00. 29730. 26860. 22770. 21780. 19120. 17530. 13550. 11680. 10230. 09400. 0787 P(y j ) P(x i |
i, j
y j ) lg P(x i |y j )
(2)
式中, P(y i ) 为单独发生事件y i 的概率, P (x i |y j ) 为在发生事件y j 的条件下事件x i 发生的条件概率。
显然, 当X 和Y 完全独立时, 有H (X |Y) =H (X ) ; 而当X 和Y 完全相关(即具有完全确定的关系) 时, H (X |Y) =0; 对于一般相关变量, 有H (X |Y) >0。同理, 也可以定义Y 对于X 的条件信息熵H (Y |X ) 。
对于整个变量X , 由于变量Y 的发生及二者间的相关性, 使其不确定性减少的熵值称为互信息熵(简称互信息, Mutual information ) I (X |Y) , 定义如下:
I (X , Y) =H (X ) -H (X |Y)
(3)
可以证明:互信息具有非负性I (X , Y) 0; 同时还具有互易性, 即:
I (X,Y) =H(X)-H(X|Y) =H(Y)-H(Y|X) =I (Y,X)
(4)
引入
X
和
Y
的联合信息(Joint
(5)
information ) H (X , Y) :
H (X , Y) =-
P (x i , y j ) lg P(x i , y j )
i, j
式中, P (x i , y j ) 为x i 与y j 的联合概率, 即事件x i 与事件y j 同时发生的概率, 这样互信息I (X , Y) 为:
I (X , Y) =H (X ) +H (Y) -H (X , Y)
(6)
值得特别指出, 互信息对变量的分布类型没有任何特殊要求, 而且它不仅能描述变量间的线性相关关系, 也能描述变量间的非线性相关关系。Fraser 与Swinney 在寻找重建相空间的最佳滞后时间 的研究中, 即应用互信息的第一极小值作为确定 的标志, 并指出这比用自相关函数首次通过零点来确定 的方法更好[4]。
互信息的缺陷是没有归一化。为了比较不同对变量之间的相依程度, 提出! 广义相关函数?(General correlation function ) R g , 定义如下:
R g =
)
第3期丁 晶, 等:以互信息为基础的广义相关系数
3
2. 1. 2 等概率法
以往由于网格数难以确定, 在互信息算法中很少见到这种方法, X 和Y 的概率大小等概率来划分网格。这样可以将每一个变量均匀地(主要指每组中的样本点数) 划分成几组, 求出的信息熵比等间距法求出的熵值要大些。由于等概率划分法只涉及样本的序位信息, 而与其数值大小没有直接关系, 因而按此方法求得的互信息熵及广义相关系数R g 值与变量的分布没有关系, 即当相关程度相同时, 对于不同的总体分布, 按等概率法求出的广义相关系数R g 在允许误差范围内是相同的。表2表明了这一点, 计算条件及使用的符号同表1。
表2 不同总体条件下的广义相关系数均值
Tab. 2 The average of general correlation coefficients in
different populations
样本容量n 30405065701003004005008001, 000
网格划分nb 8#9#9#10#11#12#19#21#23#28#30#
8991011121921232830
正态分布0. 44660. 35600. 34500. 31980. 30000. 28600. 21460. 19320. 18140. 16070. 1456
分布
Cs =1. 00. 44720. 35590. 34590. 31940. 30060. 28540. 21430. 19280. 18140. 16080. 1470
Cs =2. 00. 44650. 35590. 34520. 31930. 30070. 28610. 21440. 19300. 18140. 16060. 1471
不同的划分, 将求出不同的广义相关系数R g , 这对分析工作不利。
由于每一个盒子代表了一个基本事件, 因而盒子总数也就是基本事件总数。这样按照变量分布特征及有关客观因素事先定出基本事件数及各种事件的划分, 才是较合理的。实际工作中常面对的只是一系列数据, 一般只能按以往的经验来划分。文献[9]认为, 在概率统计计算中, 观测值为100个或更多的资料, 分为10~15组为宜。文献[8]给出了一个确定分组数的经验公式:
m =1. 87#(n -1)
2/5
(8)
式中, n 为样本数。表3提供了分组数参考。文献[8, 9]中的观点是一致的, 式(8) 较为方便。作者首次将该判据用到互信息及广义相关系数R g 计算中盒子数的确定(即变量X , Y 的分组数确定) 。
表3 数据分组数参考表
Tab. 3 The reference to grouping for data
样本容量40~602008002000
分组数样本容量6~8162739
10040010005000
分组数7~9203056
样本容量150600150010000
分组数10~15243574
2. 3 算法比较
一般说来, 在网格数一样的情况下, 三种方法求得的广义相关系数基本接近, 但有一定差别。这是网格划分的考虑原则不同所造成的。表4、图1给出了三种方法求得的金沙江屏山站日流量序列的各阶广义相关系数R g , 其中k 为阶数, 样本容量为7000, 网格划分均为64#64。
表4 三种方法估计的屏山站日流量不同阶数对应的广
义相关系数
Tab. 4 General correlation coefficients o f different orders
for da ily flows at Ping Shan station based on three methods
阶数k 12345678910
等概率法1. 0000. 66320. 56580. 51390. 47630. 44780. 40750. 39120. 37850. 3675
等间距法1. 0000. 70120. 61230. 55960. 52300. 49450. 47320. 45550. 43940. 4122
等概率递推法
1. 0000. 78030. 68690. 62550. 58110. 54530. 51970. 49750. 47840. 4485
2. 1. 3 等概率递推法
该法是由Fraser 等人在等概率划分的基础上, 导出了一个求互信息的递推公式
2
3
m
[4]
。这种方法不用
1
事先将样本分成几组, 而是按等概率依次进行4, 4, 4,... , 4逐层等分, m 为最大划分层数。为了确定网格究竟划分到何时为止, 引入了x 统计检验法, 以此来判断某一网格中样本点是否均匀分布(即有无子结构) , 若分布均匀, 则不对此网格进一步划分; 否则继续划分, 直到样本点在子网格中均匀分布或样本过于稀疏为止。当将网格划分完毕后, 再按递推公式, 从最小的子网格开始, 按逐层向上倒推的办法求得互信息熵。
该法也同等概率划分法一样, 划分网格中只涉及样本的序位信息, 当变量间相关程度一样时, 对不同的总体分布, 按此法求得的广义相关系数R g 也是一样的。
2. 2 盒子数(网格数) 的确定
R g 的三种方法, 其中都涉及到一个最基本, 也是最关键的问题?
2
4
四川大学学报(工程科学版) 第34卷
3 广义相关系数的分位数
作者所定义的广义相关系数在实际中的应用, 主要有两方面:1) 是根据R g 的数值大小来判断变量间的广义相关程度; 2) 是可根据R g 随滞时的增加而发生变化的趋势, 分析诸如序列的周期性以及判断
图1 三种方法求得的广义相关系数
Fig. 1 General correlation coefficients computed
by using three methods
相关程度取得极值时的滞时大小特征, 文献[5, 6, 4, 7]在这方面作了类似工作。
在判断变量间的广义相关程度时, 由于抽样误差和算法精度的限制, 只有样本容量足够大时, 求得的R g 才趋于期望值。图2为用等概率法计算的完全独立随机序列的一阶R g 均值随样本容量n 的变化情况, 计算条件同表5。可以看出, R g 随样本容量n 增大而逐渐减小。
等间距法在计算上较为简单, 易于理解, 但求
出的互信息熵及广义相关系数R g 值与变量的总体分布有很大的关系, 而对许多实际系统, 还无法准确知道其概率分布, 这将给分析带来诸多不便, 且按等间距来划分基本事件, 没有等概率划分优越。首先是因为事件系统并不都严格按照变量的数值大小均匀分布, 可能是偏态的, 显然这样划分基本事件, 是不太合理的。其次, 按等间距划分时, 由于各组中的样本点分布不均匀, 会出现样本点很稀甚至为零的组, 这样会影响求出的概率P i =n i /n 的可能性(n i 为网格i 中的样本点数, n 为样本容量) , 误差可能较大, 再有, 格子人为划定, 存在着! 起点效应?。而在这两方面, 等概率划分法具有较大优势。
在等概率递推法中, 不需要事先定出网格数目, 而是在逐层划分过程中用统计检验法定出, 较为客观, 且计算中只涉及样本序位信息, 与样本大小无直接关系, 但网格划分按4的倍数增加, 组数增加太快, 且不能取任意的分组数。在判断子网格中数据点是否分布均匀时, 还存在着如何选取合适的统计检验方法、检验量以及选取适当的置信度问题。实际计算表明, 由Fraser 等建议的x 统计检验法定出的网格数大大超出了公式(8) 求出的值, 尤其是在数据中有噪声时, 会大大影响网格的划分, 因为在这种情况下, 检验方法往往很难因子网格中数据点分布均匀而终止划份。大多数情况下却由于数据点过稀而终止划分, 从而使划分的层次很多, 形成庞大的子网格系统, 这从成因分析上讲是不合理的。此外, 该算法较为复杂, 不便于推广, 划分层数过多时(统计检验成果往往要求这样) , 在计算机上实现, 常因内存限制而使程序编制、运行速度成为很大问题, 一般最大可划分为7层, 即划出16384个网格。等间距法和等概率法由于事先定出网格数目, 因而不存在以上问题。
综上所述, 等概率法在实际分析中计算简单, 分组客观, 具有较大优越性, 虽然组数难以准确确定,
(2
[4]
图2 一阶广义相关系数R g 均值 R g 随样本容量n 的变化 F ig. 2 The average of general correlation coefficient of
first order varying with sam ple size 表5 广义相关系数分为数表
T ab. 5 Quantile table of general correlation coefficients
置信水平!
样本容量n 网格划分nb
1%
30323540505465701001201502003004005008001, 0002, 0003, 0005, 0007, 00010, 000
8#88#88#88#89#99#910#1010#1012#1213#1314#1416#1619#1921#2123#2328#2830#3040#4046#4657#5765#6575#75
0. 54560. 52870. 48910. 4490. 42330. 40370. 38650. 36570. 33680. 32040. 27170. 27110. 24060. 21510. 20050. 17530. 1580. 12930. 16940. 09520. 08540. 0759
5%0. 50490. 4870. 45740. 42190. 3980. 38030. 3680. 34530. 32150. 30630. 27910. 26110. 23280. 20870. 1950. 17070. 15440. 12670. 10750. 09390. 08410. 0753
10%0. 49260. 47920. 44120. 40530. 38540. 36570. 35520. 33670. 31380. 2990. 27240. 25550. 22870. 20530. 19180. 16860. 15240. 12550. 10640. 09310. 08340. 0748
20%0. 47870. 45830. 42310. 38860. 37280. 35250. 34240. 32270. 3040. 28990. 2650. 24920. 22380. 20110. 18810. 16590. 150. 1240. 10540. 09210. 08270. 0743
第3期丁 晶, 等:以互信息为基础的广义相关系数
5
由于互信息函数的定义较为复杂, 且对于常面临的离散序列, 从理论上给出一个判定相关程度的临界值较为困难, 而连续变量的互信息即自信息量与离散序列的有一定差异[2, 3], 基于上述原因, 本文利用统计实验的方法给出了判定广义相关程度的临界值(或分位值表) , 其基本思想是:根据统计检验的原理, 模拟出大量的总体服从完全独立分布的随机序列, 然后统计出其广义相关系数的分位值, 如表5所示。这样, 可将从实际序列中求出的广义相关系数R ?g 值与表5中某一置信水平下的分位值R g 进行比较:若R ?g >R g , 则可认为变量间是广义相关的; 否则是独立的。表5中, 采用等概率法计算R g 值, 网格数的划分参照公式(8) , 对应于每一个样本容量n 所模拟的完全独立分布的随机样本总数ns 为n %1000时, ns =10000; 当n >1000时, ns =1000。! 为置信水平, nb 为网格数。经电算统计分析, 表5中误差不超过0. 005。该表适用于任意分布的序列中以等概率法计算出的广义相关系数R ?g 的检验, 表中可进行插值。
据引入到互信息及广义相关系数算法中, 比较合理而成功地解决了网格数确定问题。等概率法计算出的结果与序列的总体概率分布无关, 分组较为客观、合理, 且计算简便, 较其他算法更优越;
3) 为判断变量间的广义相关性, 作者通过统计实验途径, 采用等概率法得到了广义相关系数R g 分位数表。该表适用于从总体服从任意分布的序列中按等概率法计算出得广义相关系数值的检验。参考文献:
[1]丁 晶, 邓育仁. 随机水文学[M]. 成都:成都科技大学出版社, 1988. 34~54.
[2]金阵玉. 信息论[M]. 北京:北京理工大学出版社, 1991. 7~47.
[3]周荫清. 信息理论基础[M ].北京:北京航空航天大学出版社, 1993. 11~56.
[4]Andrew M, Fraser, Harry L, Swinney. Independent coordi nates from mutual information[J].Physical Review A, 1986, 33(2) :1134~1140.
[5]杨志安, 王光瑞, 任光耀. 强迫Brusselator 系统延迟时间的确定[J].新疆大学学报, 1994, 11(4) :60~65.
[6]杨志安. Rossier 系统延迟时间的确定[J]. 非线性动力学学报, 1995, 2(2) :127~134.
[7]杨志安. 用等间距分格子法集算互信息函数确定延迟时间[J].计算物理, 1995, 12(4) :442~448.
[8]庄楚强, 吴亚森. 应用数理统计基础[M]. 广州:华南理工大学出版社, 1992.
[9]李维铮. 应用统计学[M].北京:高等教育出版社, 1991.
(编辑 张 琼)
4 结 论
1) 在变量间的相关性分析中引入互信息函数, 可以很好地描述变量间线性或非线性的广义相关特性。文中所定义的广义相关系数R g 可作为判定变量间广义相关程度的一种指标;
2) 对求广义相关系数R g 的几种算法进行了详细的比较讨论, 将概率统计中确定样本分组数的依
范文五:相关系数
clear all
close all
x1=randn(1,5000); %生成随机信号x1
subplot(4,1,1);
plot(x1);
y1=x1(2000:1:4000); %取x1信号中的一部分
y4=zeros(1,1999);
x3=[y4,y1];
hold on
plot(x3,'y')
y2=randn(1,1999);
y3=randn(1,1000);
x2=[y2,y1,y3]; %把取出的x1中信号加到x2中
subplot(4,1,2);
plot(x2);
hold on
plot(x3,'r')
%下面对信号x1,x2做归一化处理(减均值再除以标准差)
m1=mean(x1); %求x1均值
m2=mean(x2); %求x2均值
s1=std(x1); %求x1的标准差
s2=std(x1); %求x2的标准差
x11=(x1-m1)/s1; %对x1做归一化处理
x22=(x2-m2)/s2; %对x2做归一化处理
%相关系数计算,用归一化处理后的数据计算
%(两信号对应点相乘,将相乘结果相加在一起,最后将所加的喝除以N,N指的是信号的点数)
r=(sum(x11.*x22)) / (length(x11))
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%下面是将相同的数据减少到1000点,比较上面的有2000点相同的数据,相关系数的大小
clear all
close all
x1=randn(1,5000); %生成随机信号x1
subplot(4,1,1);
plot(x1);
y1=x1(2000:1:3000); %取x1信号中的一部分
y4=zeros(1,1999);
x3=[y4,y1];
hold on
plot(x3,'y')
y2=randn(1,1999);
y3=randn(1,2000);
x2=[y2,y1,y3]; %把取出的x1中信号加到x2中
subplot(4,1,2);
plot(x2);
hold on
plot(x3,'r')
%下面对信号x1,x2做归一化处理(减均值再除以标准差)
m1=mean(x1); %求x1均值
m2=mean(x2); %求x2均值
s1=std(x1); %求x1的标准差
s2=std(x1); %求x2的标准差
x11=(x1-m1)/s1; %对x1做归一化处理
x22=(x2-m2)/s2; %对x2做归一化处理
%相关系数计算,用归一化处理后的数据计算
%(两信号对应点相乘,将相乘结果相加在一起,最后将所加的喝除以N,N指的是信号的点数)
r=(sum(x11.*x22)) / (length(x11))
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%验证自己和自己做相关,相关系数为接近1
clear all
close all
x1=randn(1,5000); %生成随机信号x1
subplot(4,1,1);
plot(x1);
y1=x1(2000:1:3000); %取x1信号中的一部分
y4=zeros(1,1999);
x3=[y4,y1];
hold on
plot(x3,'y')
y2=randn(1,1999);
y3=randn(1,2000);
x2=[y2,y1,y3]; %把取出的x1中信号加到x2中
subplot(4,1,2);
plot(x2);
hold on
plot(x3,'r')
%下面对信号x1,x2做归一化处理(减均值再除以标准差)
m1=mean(x1); %求x1均值
m2=mean(x2); %求x2均值
s1=std(x1); %求x1的标准差
s2=std(x1); %求x2的标准差
x11=(x1-m1)/s1; %对x1做归一化处理
x22=(x2-m2)/s2; %对x2做归一化处理
%相关系数计算,用
归一化处理后的数据计算
%(两信号对应点相乘,将相乘结果相加在一起,最后将所加的喝除以N,N指的是信号的点数)
r11=(sum(x11.*x11)) / (length(x11))
r22=(sum(x22.*x22)) / (length(x22))
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%验证两个没有关联性的随机数,相关性接近0
clear all
close all
x1=randn(1,5000); %生成随机信号x1
subplot(4,1,1);
plot(x1);
x2=randn(1,5000); %生成随机信号x2
subplot(4,1,2);
plot(x2);
%下面对信号x1,x2做归一化处理(减均值再除以标准差)
m1=mean(x1); %求x1均值
m2=mean(x2); %求x2均值
s1=std(x1); %求x1的标准差
s2=std(x1); %求x2的标准差
x11=(x1-m1)/s1; %对x1做归一化处理
x22=(x2-m2)/s2; %对x2做归一化处理
%相关系数计算,用归一化处理后的数据计算
%(两信号对应点相乘,将相乘结果相加在一起,最后将所加的喝除以N,N指的是信号的点数)
r=(sum(x11.*x22)) / (length(x11))
转载请注明出处范文大全网 » 相关系数的定义公式为:-中国