范文一:EXCEL回归分析结果分析
Excel?回归分析结?果的详细阐?释
利用E?xcel的?数据分析进?行回归,可?以得到一系?列的统计参?量。下面以?连续10年?积雪深度和?灌溉面积序?列(图1)?为例给予详?细的说明。?
图1? 连续10?年的最大积?雪深度与灌?溉面积(1?971,1?980)
?回归结果摘?要(Sum?mary ?Outpu?t)如下(?图2):
?
图2 ?利用数据分?析工具得到?的回归结果?
第一部分?:回归统计?表
这一部?分给出了相?关系数、测?定系数、校?正测定系数?、标准误差?和样本数目?如下(表1?):
表1? 回归统计?表
逐?行说明如下?:
Mul?tiple?对应的数据?是相关系数?(corr?elati?on co?effic?ient)?,即R=0?.9894?16。 R? Squa?re对应的?数值为测定?系数(de?termi?natio?n coe?ffici?ent),?或称拟合优?度(goo?dness? of f?it),它?是相关系数?的平方,即?有R2=0?.9894?162=0?.9789?44。 A?djust?ed对应的?是校正测定?系数(ad?juste?d det?ermin?ation? coef?ficie?nt),计?算公式为 ?
式中n?为样本数,?m为变量数?,R2为测?定系数。对?于本例,n?=10,m?=1,R2?=0.97?8944,?代入上式得?
标准误差(?st?andar?d err?or)对应?的即所谓标?准误差,计?算公式为 ?
这里S?Se为剩余?平方和,可?以从下面的?方差分析表?中读出,即?有SSe=?16.10?676,代?入上式可得?
最后?一行的观测?值对应的是?样本数目,?即有n=1?0。
第?二部分,方?差分析表
?方差分析部?分包括自由?度、误差平?方和、均方?差、F值、?P值等(表?2)。 表?2 方差分?析表(AN?OVA)
?
逐列、?分行说明如?下:
第一列?df对应?的是自由度?(degr?ee of? free?dom),?第一行是回?归自由度d?fr,等于?变量数目,?即dfr=?m;第二行?为残差自由?度dfe,?等于样本数?目减去变量?数目再减1?,即有df?e=n-m?-1;第三?行为总自由?度dft,?等于样本数?目减1,即?有dft=?n-1。对?于本例,m?=1,n=?10,因此?,dfr=?1,dfe?=n-m-?1=8,d?ft=n-?1=9。 ?第二列SS?对应的是误?差平方和,?或称变差。?第一行为回?归平方和或?称回归变差?SSr,即?有
它?表征的是因?变量的预测?值对其平均?值的总偏差?。
第二行?为剩余平方?和(也称残?差平方和)?或称剩余变?差SSe,?即有
?它表征的是?因变量对其?预测值的总?偏差,这个?数值越大,?意味着拟合?的效果越差?。上述的y?的标准误差?即由SSe?给出。
第?三行为总平?方和或称总?变差SSt?,即有
?
它表示的?是因变量对?其平均值的?总偏差。容?易验证74?8.854?2+16.?10676?=764.?961,即?有
而?测定系数就?是回归平方?和在总平方?和中所占的?比重,即有?
显然?这个数值越?大,拟合的?效果也就越?好。
第四?列MS对应?的是均方差?,它是误差?平方和除以?相应的自由?度得到的商?。第一行为?回归均方差?MSr,即?有
第?二行为剩余?均方差MS?e,即有
?
显然这?个数值越小?,拟合的效?果也就越好?。
第四列?对应的是F?值,用于线?性关系的判?定。对于一?元线性回归?,F值的计?算公式为
?
式中R?2=0.9?78944?,dfe=?10-1-?1=8,因?此
第?五列Sig?nific?ance ?F对应的是?在显著性水?平下的Fα?临界值,其?实等于P值?,即弃真概率。所谓?“?弃真概率”?即模型为假?的概率,显?然1-P便?是模型为真?的概率。可?见,P值越?小越好。对?于本例,P?=0.00?00000?542<0?.0001?,故置信度?达到99.?99%以上?。>0?.0001?,故置信度?达到99.?99%以上?。>
第三?部分,回归?参数表
回?归参数表包?括回归模型?的截距、斜?率及其有关?的检验参数?(表3)。? 表3 回?归参数表
?
?第一列Co?effic?ients?对应的模型?的回归系数?,包括截距?a=2.3?56437?929和斜?率b=1.?81292?1065,?由此可以建?立回归模型?
或
?
第二列?为回归系数?的标准误差?(用 或 ?表示),误?差值越小,?表明参数的?精确度越高?。这个参数?较少使用,?只是在一些?特别的场合?出现。例如?L. Be?nguig?ui等人在?When ?and w?here ?is a ?city ?fract?al?一文?中将斜率对?应的标准误?差值作为分?形演化的标?准,建议采?用0.04?作为分维判?定的统计指?标(参见E?PB200?0)。
不?常使用标准?误差的原因?在于:其统?计信息已经?包含在后述?的t检验中?。 第三列?t Sta?t对应的是?统计量t值?,用于对模?型参数的检?验,需要查?表才能决定?。t值是回?归系数与其?标准误差的?比值,即有?
,
?的数据容易?算出: ?根据表3中
?,
对于?一元线性回?归,t值可?用相关系数?或测定系数?计算,公式?如下
?将R=0.?98941?6、n=1?0、m=1?代入上式得?到
对?于一元线性?回归,F值?与t值都与?相关系数R?等价,因此?,相关系数?检验就已包?含了这部分?信息。但是?,对于多元?线性回归,?t检验就不?可缺省了。? 第四列P? valu?e对应的是?参数的P值?(双侧)。?当P<><><>
P?=0.00?00000?542<0?.0001?,故可认为?在α=0.?0001的?水平上显著?,或者置信?度达到99?.99%。?p值检验与?t值检验是?等价的,但?p值不用查?表,显然要?方便得多。? 最后几列?给出的回归?系数以95?%为置信区?间的上限和?下限。可以?看出,在α?="0.05?的显著水平?上,截距的?变化上限和?下限为-1?.8586?5和6.5?7153,?即有">0?.0001?,故可认为?在α=0.?0001的?水平上显著?,或者置信?度达到99?.99%。?p值检验与?t值检验是?等价的,但?p值不用查?表,显然要?方便得多。?>
?斜率的变化?极限则为1?.5961?5和2.0?2969,?即有
?
第四部分?,残差输出?结果
这一?部分为选择?输出内容,?如果在“回?归”分析选?项框中没有?选中有关内?容,则输出?结果不会给?出这部分结?果。
残差?输出中包括?观测值序号?(第一列,?用i表示)?,因变量的?预测值(第?二列,用 ?表示),残?差(res?idual?s,第三列?,用ei表?示)以及标?准残差(表?4)。 表?4 残差输?出结果
?
预测值是?用回归模型?
计算?的结果,式?中xi即原?始数据的中?的自变量。?从图1可见?,x1=1?5.2,代?入上式,得?
其?余依此类推?。
残差e?i的计算公?式为
?从图1可见?,y1=2?8.6,代?入上式,得?到
其?余依此类推?。
标准残?差即残差的?数据标准化?结果,借助?均值命令a?verag?e和标准差?命令std?ev容易验?证,残差的?算术平均值?为0,标准?差为1.3?37774?。利用求平?均值命令s?tanda?rdize?(残差的单?元格范围,?均值,标准?差)立即算?出表4中的?结果。当然?,也可以利?用数据标准?化公式
?
逐一计?算。将残差?平方再求和?,便得到残?差平方和即?剩余平方和?,即有
?
利用Ex?cel的求?平方和命令?sumsq?容易验证上?述结果。
?以最大积雪?深度xi为?自变量,以?残差ei为?因变量,作?散点图,可?得残差图(?图3)。残?差点列的分?布越是没有?趋势(没有?规则,即越?是随机),?回归的结果?就越是可靠?。
用最大?积雪深度x?i为自变量?,用灌溉面?积yi及其?预测值 为?因变量,作?散点图,可?得线性拟合?图(图4)?。
图?3 残差图?
图4? 线性拟合?图
第五部分,概率??输出结果
)?。第一列是?按?在选项输出?中,还有一?个概率输出?(Prob?abili?ty Ou?tput)?表(表5等差数列?设计的百分?比排位,第?二列则是原?始数据因变?量的自下而?上排序(即?从小到大)?——选中图?1中的第三?列(C列)?数据,用鼠?标点击自下?而上排序按?钮 ,立即?得到表5中?的第二列数?值。当然,?也可以沿着?主菜单的“?数据(D)?? 排序(?S)”路径?,打开数据?排序选项框?,进行数据?排序。
用?表5中的数?据作散点图?,可以得到?Excel?所谓的正态?概率图(图?5)。 表?5 概率输?出表
?
图5 ?正态概率图?
【几点说?明】
第一,? 多元线?性回归与一?元线性回归?结果相似,?只是变量数?目m?1,?F值和t值?等统计量与?R值也不再?等价,因而?不能直接从?相关系数计?算出来。 ?第二, 利?用SPSS?给出的结果?与Exce?l也大同小?异。当然,?SPSS可?以给出更多?的统计量,?如DW值。?在表示方法?上,SPS?S也有一些?不同,例如?P Val?ue(P值?)用 Si?g.(显著?性)表征,?因为二者等?价。只要能?够读懂Ex?cel的回?归摘要,就?可以读懂S?PSS回归?输出结果的?大部分内容?。
?
范文二:回归结果分析
第23课
回归结果分析
分析和说明回归结果
最小二乘估计法为拟合线性回归模型(例如:多项式曲线)提供了一种方法。得到回归模型之后,量化以下两点是有用的:
1、 回归的显著性
2、 参数估计和预测的精确性
回归的显著性可以用方差分析方法进行分析。估计和预测的精确性与回归参数的均值和方差有关。
回归的方差分析
如果下面的假设为真,则回归项没有显著性(它没有说明y 的任何变化性):
也就是说,y 的均值是一个不取决于独立变量x 的常量。
这一假设可以用一个基于平方和的统计量来进行检验,如下所示的:
SST 测度没有使用回归模型时y 的变化性; SSE 测度使用了回归模型时y 的变化性; SSR 测度由回归模型说明的y 的变化性。
用来检验回归的显著性的统计量是回归平方和均值与误差平方和均值的比值:
E [MSR ]取决于回归系数
的比值对这些系数的级数敏感。 当
为真,
符合自由度参数为
大、p值小,则
和
的
分布。拒绝域和p值是
的数量级,而E [MSE ]不取决于回归系数,因此它们
从这一分布中得到的。如果
被拒绝且回归是显著的。
线性回归的ANOV A 表:
SS
来源
df
MS
F
p
回归
SSR
νR =m -1
MSR= SSR/νR
F R = MSR/MSE
p = 1-F F , νR, ν
E (F )
误差
SSR
νE = n-m
MSR= SSR/νE
总和
SST
νT = n -1
R平方系数为:
常用
来描述一个回归的拟合程度。
,
是最理想的拟合。 和p值,是从回归
中得到。
MATLAB的内部函数regress 提供的
回归参数和预测值的特性
从回归分析中得到的参数
的估计值具有下面的一般形式:
因此,估计值是测量值
的线性组合,且每个测量值被赋予一个只取决于已
知量x 的值
的权重系数。这样,回归参数的估计值与样本均值相似,
也是测量值的一个线性组合。
每个回归参数的估计值是有自己的CDF 的随机变量。它的均值和方差可以从估计值和测量值方程以及残差e i .. 的假设的统计学特性E [e i ]=0, Var [e i ]=σe 中找到,假设所有的残差都是独立的:
2
未知残差的方差
可以通过下式进行近似:
最小二乘法的回归参数是无偏的和相容的。
从回归参数中得到的预测值也是一个随机变量,该变量是测量值的一个线性组合。课堂中讨论的关于二项式回归模型的例子:
在任意x 处的均值和方差为:
这些结果也可应用到其他的
。
回归参数的置信区间
当样本容量n 较大时,回归参数近视服从正态分布,且每一个估计值的CDF 完全可以用它的均值和方差来定义:
求取大样本的置信区间和假设检验的步骤与求取样本均值的步骤是一样的。
1?α大样本双边置信区间是:
其中
和是从单一正态分布中获得的(对于,):
当样本容量n 较小且残差符合正态分布时,回归参数符合自由度为双边置信区间可以通过用
代替上面方程中的
来计算。
的t 分布。
回归系数的置信区间可以通过MATLAB 的内部函数regress 来估计。
回归预测的置信区间
当样本的容量n 较大时,回归预测值接近于正态分布,其 CDF完全可以用它的均值和方差来定义:
双边大样本置信区间是:
其中
当样本的容量n
较小且残差服从正态分布时,回归预测值符合自由度为分布。双边置信区间按大样本的情况来计算,只需用
回归预测的置信区间取决于x 及x 与对应测量值以通过MATLAB 中的内部函数regress 来估计。
代替方程中的
。
的t
和预测值的标准偏差可以由前面给出的方程中求得,
可以用
来近似。
的距离。这个区间可
版权属于麻省理工学院 2003年
最后修改日期 2003年10月8日
范文三:回归分析结果
1.复杂法
Dependent Variable: Y
Method: Least Squares
Date: 05/29/13 Time: 16:23
Sample(adjusted): 1958 1974
Included observations: 17 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -71.38141 19.91206 -3.584833 0.0033
Z0 0.661393 0.165246 4.002488 0.0015
Z1 0.900763 0.482702 1.866083 0.0847
Z2 -0.431647 0.166337 -2.595007 0.0222 R-squared 0.996803 Mean dependent var 818.6900 Adjusted R-squared 0.996065 S.D. dependent var 279.9174 S.E. of regression 17.55873 Akaike info criterion 8.771303 Sum squared resid 4008.015 Schwarz criterion 8.967353 Log likelihood -70.55608 F-statistic 1351.083 Durbin-Watson stat 1.847312 Prob(F-statistic) 0.000000
2.简单法
Dependent Variable: Y
Method: Least Squares
Date: 05/29/13 Time: 16:25
Sample(adjusted): 1958 1974
Included observations: 17 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -71.38141 19.91206 -3.584833 0.0033
PDL01 1.130509 0.179875 6.284984 0.0000
PDL02 0.037469 0.162261 0.230919 0.8210
PDL03 -0.431647 0.166337 -2.595007 0.0222 R-squared 0.996803 Mean dependent var 818.6900 Adjusted R-squared 0.996065 S.D. dependent var 279.9174 S.E. of regression 17.55873 Akaike info criterion 8.771303 Sum squared resid 4008.015 Schwarz criterion 8.967353 Log likelihood -70.55608 F-statistic 1351.083 Durbin-Watson stat 1.847312 Prob(F-statistic) 0.000000
Lag i CoefficienStd. Error T-Statistic Distribution of X t
. * | 0 0.66139 0.16525 4.00249
. *| 1 1.13051 0.17987 6.28498
. * | 2 0.73633 0.16412 4.48665
* . | 3 -0.52114 0.23465 -2.22093
Sum of 2.00709 0.06324 31.7393
Lags
3.德宾h法检验自相关
Dependent Variable: Y
Method: Least Squares
Date: 05/29/13 Time: 16:27
Sample(adjusted): 1967 1995
Included observations: 29 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -6.905686 4.179931 -1.652105 0.1105
X 0.251865 0.043638 5.771717 0.0000
Y(-1) 0.813628 0.062991 12.91657 0.0000 R-squared 0.997002 Mean dependent var 268.0696 Adjusted R-squared 0.996772 S.D. dependent var 158.7886 S.E. of regression 9.021969 Akaike info criterion 7.334900 Sum squared resid 2116.294 Schwarz criterion 7.476344 Log likelihood -103.3560 F-statistic 4323.744 Durbin-Watson stat 1.215935 Prob(F-statistic) 0.000000
*?Var(),=0.00397 d=1.215935 1
(1):0:0HH残差无自相关(即);残差有自相关,,,,01
n?(2)Hh成立时,,,0*?1(),nVar,1
1n,,,(1)2.244dN(0,1)*?21(),nVar1,
p{h>h}=, ,2
*?(3)根据回归分析结果得到的,dVar,,1.215935()0.003971,得h=2.244
(4)根据查标准正态分布表得到h,1.96,,2
(5)2.244196比较大小,h=>.=h,拒绝,说明H,,00,2
,Yu和4.工具变量法消除之间的相关 tt1,
Dependent Variable: Y
Method: Least Squares
Date: 05/29/13 Time: 16:37
Sample(adjusted): 1968 1995
Included observations: 28 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -10.40075 8.424768 -1.234545 0.2285
X(-1) 0.617252 0.097159 6.352989 0.0000
X(-2) 0.454482 0.120473 3.772478 0.0009 R-squared 0.986457 Mean dependent var 273.7470 Adjusted R-squared 0.985373 S.D. dependent var 158.6766 S.E. of regression 19.19043 Akaike info criterion 8.847658 Sum squared resid 9206.816 Schwarz criterion 8.990394 Log likelihood -120.8672 F-statistic 910.4749 Durbin-Watson stat 1.278985 Prob(F-statistic) 0.000000
Dependent Variable: Y
Method: Least Squares
Date: 05/29/13 Time: 16:38
Sample(adjusted): 1967 1995
Included observations: 29 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -0.481995 6.392182 -0.075404 0.9405
X 0.456983 0.050070 9.126859 0.0000
YF(-1) 0.542658 0.075271 7.209358 0.0000 R-squared 0.992587 Mean dependent var 268.0696 Adjusted R-squared 0.992016 S.D. dependent var 158.7886 S.E. of regression 14.18796 Akaike info criterion 8.240362 Sum squared resid 5233.755 Schwarz criterion 8.381806 Log likelihood -116.4852 F-statistic 1740.584 Durbin-Watson stat 1.268465 Prob(F-statistic) 0.000000 ?YXX,,,,10.400750.6172520.454482 ttt,,12
*?YXYu,,,,,0.4819950.4569830.542658 tttt,1
5. 德宾h法检验自相关
Dependent Variable: Y
Method: Least Squares
Date: 05/29/13 Time: 16:39
Sample(adjusted): 1968 1995
Included observations: 28 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -1.792298 3.834594 -0.467402 0.6444
X 0.235682 0.033947 6.942619 0.0000
Y(-1) 1.287023 0.121021 10.63474 0.0000
Y(-2) -0.514477 0.126037 -4.081945 0.0004 R-squared 0.998325 Mean dependent var 273.7470 Adjusted R-squared 0.998115 S.D. dependent var 158.6766 S.E. of regression 6.888881 Akaike info criterion 6.829258 Sum squared resid 1138.960 Schwarz criterion 7.019573 Log likelihood -91.60961 F-statistic 4766.971 Durbin-Watson stat 2.228279 Prob(F-statistic) 0.000000
(1):0:0HH残差无自相关(即);残差有自相关,,,,01
n?(2)Hh成立时,,,0*?1(),nVar,1
1n,,,,(1)0.7856dN(0,1)*?21(),nVar1,
p{h>h}=, ,2
*?(3)根据回归分析结果得到的,dVar,,2.228279()0.01471,得h=-0.7856
(4)根据查标准正态分布表得到h,1.96,,2
=0h,接受,说明H,,(5)078561.96比较大小,若h=.,02
范文四:试验结果分析 回归分析
试验结果分析 回归分析
4.7.1陶瓷原料成分对衬垫性能参数的回归分析
陶瓷原料的成分主要有Al 2O 3,SiO 2,MgO ,CaO ,K 2O ,Na 2O ,因为MgO 和CaO 作用相同,K 2O 和Na 2O 作用相同,所以一般将MgO 和CaO 合在一起分析,将K 2O 和Na 2O 一起分析。原始数据共有65组,将每个配方的各个主要成分的百分含量列在表中(如表4—12所示),利用Excel 的回归分析功能即可得出各个成分对最高熔化温度的影响。成分对烧结温度影响的回归分析见表4—13,成分对最高熔化温度影响的回归分析见4—14。(注:每一项的P 值都小于0.5,说明了回归模型的正确性)
表4—12 衬垫配方氧化物质量百分率及烧结和熔化特性原始数据表 2-1 2-2 2-3 2-4 2-5 2-6 2-7 2-8 2-9
Al 2O 3
SiO 2
MgO+CaO K 2O+Na2O 烧结温度 熔化温度区间 7.621 8.852 10.003 7.473 8.676 9.876 7.28 8.528 9.647
表4—13 成分对烧结温度影响的回归分析 Intercept Al 2O 3 SiO 2 MgO+CaO K 2O+Na2O
系数 1207.492 2.532821 -0.4368 -2.18419 -7.52851
Significance F 1.2217E-10 标准误差 80.51 1.06 0.8 1.168769 2.065107
R 平方 t 值 15 2.4 -0.55 -1.86879 -3.64558
标准误差 P-value 5.8E-22 0.01986 0.48359 0.06654 0.00056
0.575866 16.75347
1.21 1.402 1.606 1.405 1.648 1.014 1.647 1.155 1.313
1290 1260 1260 1250 1250 1240 1240 1240 1240
1530~1542 1406~1542 1405~1538 1406~1545 1425~1540 1416~1524 1522~1534 1475~1534 1414~1536
35.039 51.632 34.374 50.643 33.763 49.747 34.289 52.445 33.617 51.455 33.267 50.947 33.501 53.332 33.113 52.67 32.481
51.7
表4—14 成分对最高熔化温度影响的回归分析
Intercept Al 2O 3 SiO 2 MgO+CaO K 2O+Na2O
如果将自变量Al 2O 3,SiO 2,MgO+CaO,K 2O+Na2O 的系数分别设为
x 1, x 2, x 3, x 4,因变量烧结温度和最高熔化温度分别设为y 1, y 2,则自变量和因变量
Significance F 9.9967E-21
系数 1694.677 9.690692 -6.21706 -19.1163 -18.3524
标准误差
R 平方 t 值
标准误差 P 值 2.7E-11 0.00077 0.00352 3.4E-08 0.00106
0.806528 43.25414
207.8575 8.153073 2.732823 3.546037 2.046224 -3.03831 3.01753 -6.33507 5.331697 -3.44213
之间的关系如式(4—1) 和式(4—2) :
y 1=2.533x 1-0.437x 2-2.185x 3-7.53x 4+1207.5 (4—1) y 2=9.7x 1-6.22x 2-19.12x 3-18.35x 4+1694.68 (4—2)
从式(4—1) 中看出,(K 2O+Na2O )对烧结温度影响最大,其次是Al 2O 3,MgO+CaO,SiO 2,其中SiO 2对烧结温度的影响最小。系数为正,表明该组分的质量百分含量增加时,烧结温度增加;反之,系数为负,随着该组分质量百分含量的增加,烧结温度降低,Al 2O 3对烧结温度的影响为正,其它组分的影响为负。同理式(4—2) 分析各组分的质量百分含量对最高熔化温度的影响大小顺序依次为K 2O+Na2O ,MgO+CaO,Al 2O 3和SiO 2。
如何进行回归分析:
1.
2.
范文五:SPSS—回归—多元线性回归结果分析
SPSS—回归—多元线性回归结果分析(二)
,最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起时“。
接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示:
结果分析1:
由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出,最先进入“线性回归模型”的是“price in thousands" 建立了模型1,紧随其后的是“Wheelbase" 建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时,从“线性模型中”剔除
结果分析:
1:从“模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2 拟合优度来看,模型2的拟合优度明显比模型1要好一些
(0.422>0.300)
2:从“Anova"表中,可以看出“模型2”中的“回归平方和”为115.311,“残差平方和”为153.072,由于总平方和=回归平方和+残差平方和,由于残差平方和(即指随即误差,不可解释的误差)由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和的一半,
3:根据后面的“F统计量”的概率值为0.00,由于0.00<>
结果分析:
1:从“已排除的变量”表中,可以看出:“模型2”中各变量的T检的概率值都大于“0.05”所以,不能够引入“线性回归模型”必须剔除。
从“系数a” 表中可以看出:
1:多元线性回归方程应该为:销售量=-1.822-0.055*价格+0.061*轴距 但是,由于常数项的sig为(0.116>0.1) 所以常数项不具备显著性,所以,我们再看后面的“标准系数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除 所以:标准化的回归方程为:销售量=-0.59*价格+0.356*轴距
2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF都为1.012,且都小于5,所以两个自变量之间没有出现共线性,容忍度和 膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大
从“共线性诊断”表中可以看出:
1:共线性诊断采用的是“特征值”的方式,特征值主要用来刻画自变量的方差,诊断自变量间是否存在较强多重共线性的另一种方法是利用主成分分析法,基本思想是:如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是就可以从这些自变量中提取出既能反应自变量信息(方差),而且有相互独立的因素(成分)来,该方法主要从自变量间的相关系数矩阵出发,计算相关系数矩阵的特征值,得到相应的若干成分。
从上图可以看出:从自变量相关系数矩阵出发,计算得到了三个特征值(模型2中),最大特征值为2.847, 最小特征值为0.003
条件索引=最大特征值/相对特征值 再进行开方 (即特征值2的 条件索引为 2.847/0.150 再开方=4.351)
标准化后,方差为1,每一个特征值都能够刻画某自变量的一定比例,所有的特征值能将刻画某自变量信息的全部,于是,我们可以得到以下结论:
1:价格在方差标准化后,第一个特征值解释了其方差的0.02, 第二个特征值解释了0.97,第三个特征值解释了0.00
2:轴距在方差标准化后,第一个特征值解释了其方差的0.00, 第二个特征值解释了0.01,第三个特征值解释了0.99
可以看出:没有一个特征值,既能够解释“价格”又能够解释“轴距”所以“价格”和“轴距”之间存在共线性较弱。前面的结论进一步得到了论证。(残差统计量的表中数值怎么来的,这个计算过程,我就不写了)
从上图可以得知:大部分自变量的残差都符合正太分布,只有一,两处地方稍有偏离,如图上的(-5到-3区域的)处理偏离状态
下班了,有时间继续写,百度空间发表文章,为什么过几分钟,就输入不了文字了啊
转载请注明出处范文大全网 » EXCEL回归分析结果分析