范文一:非线性回归模型有哪些 非线性回归模型
第12章 非线性回归模型
非线性模型的基本假定 非线性模型的参数估计 回归评价和检验
1
一、非线性模型的基本假定
非线性回归分析是线性回归分析的扩展,也是传统计 量经济学的结构模型分析法。由于非线性回归的参数 估计涉及非线性优化问题,计算比较困难,推断和预 测的可靠性也要差一些,因此传统计量经济学较少研 究非线性回归。 随着计算机技术的发展,非线性回归的参数估计计算 困难得到了克服,非线性回归分析开始受到更多的重 视,现在已经成为计量经济研究的热点之一,基本形 成了与线性回归分析相对应的、比较完整的回归分析 和检验预测分析方法体系。
2
我们知道线性回归模型分析的变量线性关系只是经济变 量关系中的特例,现实中的多数经济变量关系是非线性 的。当然非线性变量关系常常可以通过初等数学变换转 化为线性回归模型,然后再运用线性回归分析方法进行 分析,但仍然有不少非线性关系无法进行这种变换。 例如,若两个经济变量之间存在关系为:
Y , X , ε
Y与X之间构成非线性关系,且该非线性显然无法通过 初等数学变换转化为线性模型。
3
此外,非线性模型的转换不仅涉及到趋势性部分,也 涉及随机误差部分,因此误差项的作用方式对于非线 性模型的转化是非常重要的。有些非线性关系就是因 为误差项是可加而不是可乘的,从而导致不能利用对 数变换进行转化。例如,若常见的柯布—道格拉斯生 产函数中的随机误差项是可加而不是可乘的,即:
Y AK L , ε
则该模型就不能通过初等数学变换转化为线性模型。
4
建立非线性计量经济模型的方法与建立线性模型是 相似的,通常也是根据经济理论、实际经济问题, 以及相关的数据图形等建立初步模型,然后通过对 模型的分析、检验、判断和比较,选择、确定和完 善模型。 进行线性回归分析时,如果通过分析和检验发现存
在把非线性关系误作线性关系的问题时,就需要考 虑把线性模型改为非线性模型,因此线性回归分析 本身也是非线性模型的一个重要来源。
5
与线性模型相似,为了保证非线性回归分析的价值及 分析工作的顺利进行等,也需要对非线性回归模型作 一些基本假设。非线性模型关于模型函数形式和参数 的假设与线性模型相似,第一条假设是模型具有上述 非线性的函数形式,关于随机误差项的假设也是满足 Var E(ε) 0, (ε) 2 I n,而且也可以要求服从正态分布,即 ε , N (0, 2In ) 。
6
二、非线性模型的参数估计
参数估计也是非线性回归分析的核心步
骤。非线 性回归分析参数估计的方法也有多种,基本方法同 样是最小二乘参数估计和最大似然估计。 在此,主要了解非线性回归参数的最小二乘估计,
也称“非线性最小二乘估计”。
7
非线性最小二乘估计就是求符合如下残差平方和
S (β) [Y ~ f (X , β)] [Y ~ f (X , β)] ? ? ? 。为了方便起见 达到极小的β 值,即为 β ( 1 , , p ) ,将把上述最优化问题的目标函数S (β) 称为“最小二 乘函数”。
当模型只有一个待估计参数时,最小二乘函数是模型 唯一参数的一元函数;当待估计参数有多个时,则是 参数向量 β 的向量函数。
8
该最小化问题在形式上与线性回归分析的最小化问题是相似 的,不同在于回归函数 f是参数的非线性函数而不是线性函数 ,因此S (β)的正规方程组不再是线性方程组,一般无法通过解 析的方法求解,必须采用某种搜索或迭代运算的非线性优化 方法获得参数估计值。
实际上,非线性最小二乘估计引出了非线性优化的需要。其 实最大似然估计量的计算等也需要用到非线性优化分析。
9
例:
Yi 1e 2 Xi , ui
2 i
? S ( ) u (Y ~ 1e
2 X i 2
)
S ( ) 2 X i 2 X i 2 (Y ~ 1e )(~e ) 0 1
S ( ) 2 X i 2 X i 2 (Y ~ 1e )(~ 1e X i ) 0
2
10
NLLS非线性最小二乘法
Y e
i
i i
2 X i
2 X i
1e
2 2 X i
Y X e
方程
1 X i e
2 2 X i
NLLS非线性最小二乘法要解决的问题是如何求解以上的
11
12
1.试错法或直接搜索法
Yi 1e
2 X i
, ui
13
假定
, 1 0.45
2 i
2 0.01
0.01 X i 2
u (Y ~ 0.45e
)
ui2 0.3044
1 0.5 2 ~0.01
u
2 i
14
0.0073
15
2. 最陡爬坡法
最陡爬坡法是常用的非线性最优化数值方法 之一。 最陡爬坡法的基本思路是:从一个初始参数
值出发,在一个给定半径的圆周上找目标函 数最大(或最小)的一组参数值,然后再以 该组参数值为出发点重复上述搜索过程,直 至收敛。
16
3.迭代线性化方法
参数的初始值的非线性方程线性化,然后用OLS估计 线性化方程,并且调整最初选取的参数值。经过调整 的参数值可用来再次线性化该模型,然后再一次用 OLS进行估计,重新调整估计值,继续这个过程直到 最后一组迭代中得到的估计值没有实质性变化。 将非线性方程线性化的主要技巧是微积分中的泰勒级 数展开。 高斯-牛顿迭代法和牛顿-拉夫森迭代法
17
18
(1)高斯,牛顿法
该方法是常用的非线性最优化迭代算法之一,其基本 思路是:非线性最小二乘估计的问题在于最小二乘函 数 S (β) 中的
f,也就是回归模型 Y f (X, β) , ε 的趋势部分不是参数向量的线性函数,因此最优化问
题
1 , , p
? ? min S (β) [Y ~ f ( X , β)] [Y ~ f ( X , β)] ? ?
需要新的求解方法。
19
当f是连续可微时,可以在某组参数初始值处作一阶泰 勒级数展开,得到f的线性近似,把这个线性近似函数 代入最小二乘函数得到参数的二次函数,克服参数估 计计算的困难。 但一阶泰勒级数展开得到的近似函数与原函数是有差 异的,用上述级数展开近似的方法得到的参数估计也 有偏差,偏差程度与泰勒级数展开的初始值与参数真 实值的偏差相关。 提高参数估计准确程度的途径是改进泰勒级数展开的 初始值,方法是把已经得到的参数估计作为新的参数 初始值,重新进行泰勒级数展开和参数估计。这种方 法可以反复运用,直到得到比较理想的参数估计值。 这种计算非线性回归参数估计的迭代算法称为“高斯 ,牛顿法”。
20
在非线性回归分析中,高斯,牛顿法实质上就是非线 性模型本身的反复线性化和线性回归,适用对象是不 能通过初等数学变换转化为线性模型,但具有连续可 微函数性质,可以利用一阶泰勒级数展开强制转换成 线性模型的非线性模型。
21
4.牛顿一拉夫森法
这种方法可以看作是高斯—牛顿法改进方法的非线性 回归迭代算法,称为牛顿—拉夫森法(newton, raphson method)。 牛顿—拉夫森法的基本思想也是利用泰勒级数展开近
似,通过迭代运算寻找最小二乘函数最优解的数值解 法。
不过牛顿—拉夫森法不是对模型非线性函数f本身做线 性近似,而是直接对最小二乘函数最优化的一阶条件 做一阶泰勒级数展开近似。
22
牛顿—拉夫森方法的缺点是迭代运算中需要 反复计算梯度向量,特别是海塞矩阵的逆矩 阵,因此计算工作量很大。 高斯,牛顿法、牛顿,拉夫森法和其他各种 非线性回归参数估计方法,都包含迭代搜索 过程。这些迭代搜索法并没有严格的优劣关 系
23
有些方法可能收敛要好一些,收敛速度较快,但另一 些方法则计算量较小。有时候一种算法不收敛,而另 一种算法却能轻易找出最有解,甚至在理论上相当不 严密的方法有时候也可能相当有效,而且我们往往无 法知道一种方法之所以有效的实际原因,也很难事先 知道对于某个具体问题究竟哪种方法最有效。 因此在大多数情况下,尝试不同的迭代搜索方法通常 是有价值的。
24
三、非线性回归评价和假设检验
非线性回归在得到参数估计值和回归方程以后,也必 须对回归结果和模型假设的正确性进行评价和判断。 评判非线性回归
的基本思路也包括回归拟合度评价, 以及模型总体和参数显著性检验等。 非线性模型参数的显著性检验常常隐含模型非线性性
的检验。由于即使非线性回归模型的误差项有好的性 质,参数估计量也不具备BLUE估计等理想性质,因 此对非线回归的评价和检验,除了不涉及参数估计量 分布性质的决定系数以外,一般要麻烦一些,而且可 靠性较差。
25
1.判决系数
判决系数不涉及参数估计量的分布性质,也不需要做以这些分 布性质为基础的假设检验,因此非线性导致的问题并不影响该 统计量在评价回归方程拟合度方面的作用,仍然是评价非线性 模型合理程度的基本指标,或者说最重要的基本指标之一。 它们在非线性回归分析中的使用方法仍然是与在线性回归分析中 相同的。
R2 1 ~
(Yi ~ Y )2
ui2 ?
26
2.t检验和总体显著性F检验
一般在线性回归分析中检验参数显著性的标准的检验 方法,以及用于评价线性回归总体显著性的F统计量, 在非线性回归中都会遇到困难。 2 因为我们无法利用回归残差得到误差项方差 的无偏 估计。即使非线性模型的误差项 ε 服从0均值的正态 分布,非线性回归的参数估计量,以及残差: ? ? ei Yi ~ f ( X1 i , , X K i ; 1 , , P ) 也不像在线性回归中的参数估计和回归残差那样服从 2分布,参数估计 正态分布,因此残差平方和不服从 量不服从正态分布,所以标准的t检验和F检验都无法 应用。
27
对于参数估计运用高斯,牛顿法的非线性回归时,可以把 线性回归的t和F检验应用到上述迭代过程中的最后一次线 性近似式。 一般来说,经过反复迭代从而得到的线性化模型应该能提 供非线性模型的一个比较好的近似,因此用对最后的线性 近似模型的检验替代对非线性模型本身的检验是有合理性 的。
事实上,运用线性化方法的非线性估计的计算机程序,通 常会计算最后一次线性化的t统计量、F统计量等指标。
28
此外,虽然非线性回归参数估计没有线性回归参数估 计的性质,但由参数估计值构造的相似的t统计量在大 样本时,还是渐近服从t分布的。 因此如果利用上述线性近似最后一次迭代得到的残差 标准差作为非线性回归误差项方差的近似,也能利用 该统计量进行参数的显著性检验,或者参数取特定值 得假设检验。
29
3.参数显著性的F检验
除了对高斯,牛顿法非线性回归可以利用最后一次线 性近似函数线性回归的t检验以外,检验非线性模型参 数的显著性还有多种其他方法。 下面这个渐近F分布的统计量就是其中的一种方法,即 [ S (β R ) ~ S (β)] / g F (g, n ~ k ) S
(β) /( n ~ k ) 这个统计量分子、分母中β 的是未对非线性模型参数 施加约束时的参数估计, 则是对模型的某些参数施 β S 加0假设约束后的参数估计, (β) 和S (βR )分别是对应两 种参数估计的残差平方和,g是0约束参数的数量。
30
很显然,如果施加0约束的参数本身对模型的影 响没有显著性,那么上述F统计量的数值会很小 ,如果这些施加0约束的参数对模型的影响是明 显的,那么该统计量的数值会较大,就会有显著 性。因此,我们可以通过检验该统计量的显著性 来判断模型参数的显著性。
31
虽然上述F统计量与线性回归模型的F统计量形式是相 似的,但因为模型是非线性的,因此 S (βR ) S (β) 和 2 并不服从 分布,该统计量并不严格服从F分布,只 是近似服从F分布。在样本容量较大时,该统计量的分 布与F分布很接近。 我们可以利用F分布检验该统计量的显著性,但检验结 果论的准确程度会受到一定影响,运用时应该加以注 意。
32
4.似然比检验
似然比检验与检验在本质上是另一种非线性模型参数 显著性检验。 似然比检验的统计量为 L(β R ) ~2(ln L(β
R ) ~ ln L(β)) ~2 ln L(β)
L( 式中 β 与 β R 的含义与上述F检验统计量中同,β)与 L(βR )则分别是它们各自对应的非线性模型被解释变量的似 然函数值。 似然函数即随机变量得到特定观测值序列的联立分布 概率密度函数。
33
我们假设非线性模型的误差项服从均值为0的正态分布,那么上 述统计量中的对数似然函数为
n e e ln L(β) ~ 1 , ln(2 ) , ln 2
n
式中,e是残差向量。如果参数估计采用的是最大似然估计,那 e e 么其中的 实际上就是误差方差的估计。 n 相应的有约束时,模型的对数似然函数为
因此,统计量
n e eR ln L(β R ) ~ 1 , ln(2 ) , ln R 2 n
34
为
e e e e e Re R n ln
~ ln n ln n n e Re R
35
对于大样本来说,该统计量渐近服从自由度为约束数 2 2 分布,因此可以根据 分布检验 量g的 2 的显著性。当该统计量比给定显著水平的 分布 临界值大时,拒绝0假设,认为所检验的参数是显著的 ,否则认为检验的参数是不显著的。 除了上述检验方法以外,非线性回归还有其他一些检 验方法,如沃尔德检验和拉格朗日乘数检验。多数方 法在本质上都是相似的。
36
面板数据
面板数据(Panel Data)又称纵列数据(Longitudinal Data),是指不同的横截面个体在不同的时间上的观 测值的
集合。从水平看,它包括了某一时间上的不同 的横截面个体的数据;从纵向看,它包括了每一横截 面的时间序列数据。 面板数据模型与一般的横截面数据模型或时间序列模 型的区别在于模型中的变量有两个下角标,例如:
Yit β Xit , it ,
i 1, 2,..., N ; t 1, 2,..., T
37
其中的i代表了横截面个体,如个人、家庭、企业或国 家等,t代表时间。因此,N代表横截面的宽度,T代 表时间的长度。 随机误差项可以分解为:
it i , t , uit
其中, i (i 1, 2,..., N )表示横截面效应,它不随时间的 变动而变动,但却随着横截面个体的不同而不同; t (t 1, 2,..., T ) 表示时间效应,它对同一时间的横截 面个体是相同的,但却随着时间的变动而变动。
38
当假设式中的 i (i 1, 2,..., N ) 或 t (t 1, 2,..., T )
是固 定的(未知)常数时,则相应的面板数据模型称为固 定效应模型。 分别对应横截面固定效应模型和时间固定效应模型及 双向固定效应模型。 当他们是一个随机变量而非固定的常数时,则相应的面 板数据模型称为随机效应模型。 横截面随机效应模型和时间随机效应模型及双向随机 效应模型。
39
面板数据模型
双向误差构成模型
单向误差构成模型
单向随机效应
单向固定效应
双
向 固 定 效 应
双
向 随 机 效 应
横
截 面 随 机 效 应
时
间 随 机 效 应
40
横
截 面 固 定 效 应
时
间 固 定 效 应
随机效应模型
固定效应模型
41
估计方法
最小二乘虚拟变量估计 广义最小二乘 估计 检验:约束检验F 设定检验
42
百度搜索“就爱阅读”,专业资料,生活学习,尽在就爱阅读网
92to.com,您的在线图书馆
43
范文二:非线性回归模型
非线性回归模型
非线性回归模型适用于:散点趋势非线性(偏离点可当做强影响点),自变量为1个或多个的情况。
自变量为1个时:
一、图形构建,观察散点趋势
二、非线性趋势
三、非线性回归拟合
四、根据数学知识写出模型表达式
五、根据知识和经验设定初始值
六、使用最小二乘法
七、
八、观察信息保留量
九、观察是否收敛
方程收敛:y=2.854exp(-0.267*time)
自变量为大于1个时(2个自变量): 一、观察自变量数量
二、图形构建,观察散点趋势
三、非线性趋势。为减少强影响点在计算残差的影响,使用最小一乘法
四、根据数学知识写出模型表达式
五、根据数学知识和经验猜测初始值
六、使用最小一乘法
七、
八、观察是否收敛
方程收敛:
y=9.441+19.563*x1+3.024*x2
范文三:非线性回归模型
第12章 非线性回归模型
?非线性模型的基本假定 ?非线性模型的参数估计 ?回归评价和检验
一、非线性模型的基本假定
?
?
非线性回归分析是线性回归分析的扩展,也是传统计 量经济学的结构模型分析法。由于非线性回归的参数 估计涉及非线性优化问题,计算比较困难,推断和预 测的可靠性也要差一些,因此传统计量经济学较少研 究非线性回归。 随着计算机技术的发展,非线性回归的参数估计计算 困难得到了克服,非线性回归分析开始受到更多的重 视,现在已经成为计量经济研究的热点之一,基本形 成了与线性回归分析相对应的、比较完整的回归分析 和检验预测分析方法体系。
?
我们知道线性回归模型分析的变量线性关系只是经济变 量关系中的特例,现实中的多数经济变量关系是非线性 的。当然非线性变量关系常常可以通过初等数学变换转 化为线性回归模型,然后再运用线性回归分析方法进行 分析,但仍然有不少非线性关系无法进行这种变换。 例如,若两个经济变量之间存在关系为:
?
Y ? ? ? ? X? ? ε
Y与X之间构成非线性关系,且该非线性显然无法通过 初等数学变换转化为线性模型。
?
此外,非线性模型的转换不仅涉及到趋势性部分,也 涉及随机误差部分,因此误差项的作用方式对于非线 性模型的转化是非常重要的。有些非线性关系就是因 为误差项是可加而不是可乘的,从而导致不能利用对 数变换进行转化。例如,若常见的柯布—道格拉斯生 产函数中的随机误差项是可加而不是可乘的,即:
Y ? AK L ? ε
则该模型就不能通过初等数学变换转化为线性模型。
?
?
?
建立非线性计量经济模型的方法与建立线性模型是 相似的,通常也是根据经济理论、实际经济问题, 以及相关的数据图形等建立初步模型,然后通过对 模型的分析、检验、判断和比较,选择、确定和完 善模型。 进行线性回归分析时,如果通过分析和检验发现存
?
在把非线性关系误作线性关系的问题时,就需要考 虑把线性模型改为非线性模型,因此线性回归分析 本身也是非线性模型的一个重要来源。
与线性模型相似,为了保证非线性回归分析的价值及 分析工作的顺利进行等,也需要对非线性回归模型作 一些基本假设。非线性模型关于模型函数形式和参数 的假设与线性模型相似,第一条假设是模型具有上述 非线性的函数形式,关于随机误差项的假设也是满足 Var E(ε) ? 0, (ε) ? ? 2 I n,而且也可以要求服从正态分布,即 ε ~ N (0,? 2In ) 。
?
二、非线性模型的参数估计
?
参数估计也是非线性回归分析的核心步
骤。非线 性回归分析参数估计的方法也有多种,基本方法同 样是最小二乘参数估计和最大似然估计。 在此,主要了解非线性回归参数的最小二乘估计,
?
也称“非线性最小二乘估计”。
?
非线性最小二乘估计就是求符合如下残差平方和
S (β) ? [Y ? f (X , β)]?[Y ? f (X , β)] ? ? ? 。为了方便起见 达到极小的β 值,即为 β ? (?1 , , ? p )? ,将把上述最优化问题的目标函数S (β) 称为“最小二 乘函数”。
?
当模型只有一个待估计参数时,最小二乘函数是模型 唯一参数的一元函数;当待估计参数有多个时,则是 参数向量 β 的向量函数。
?
该最小化问题在形式上与线性回归分析的最小化问题是相似 的,不同在于回归函数 f是参数的非线性函数而不是线性函数 ,因此S (β)的正规方程组不再是线性方程组,一般无法通过解 析的方法求解,必须采用某种搜索或迭代运算的非线性优化 方法获得参数估计值。
实际上,非线性最小二乘估计引出了非线性优化的需要。其 实最大似然估计量的计算等也需要用到非线性优化分析。
?
?
例:
Yi ? ?1e?2 Xi ? ui
2 i
? S (? ) ? ? u ? ? (Y ? ?1e
?2 X i 2
)
?S ( ? ) ?2 X i ?2 X i ? 2? (Y ? ?1e )(?e ) ? 0 ??1 ?S ( ? ) ?2 X i ?2 X i ? 2? (Y ? ?1e )(? ?1e X i ) ? 0 ?? 2
NLLS非线性最小二乘法
?Y e
i
i i
?2 X i
?2 X i
? ?1e
2 ?2 X i
?Y X e
方程
? ?1 ? X i e
2 ?2 X i
NLLS非线性最小二乘法要解决的问题是如何求解以上的
1.试错法或直接搜索法
Yi ? ?1e
?2 X i
? ui
?
假定
, ?1 ? 0.45
2 i
?2 ? 0.01
0.01 X i 2
? u ? ? (Y ? 0.45e
)
ui2 ? 0.3044 ?
?1 ? 0.5 ?2 ? ?0.01
?u
2 i
? 0.0073
2. 最陡爬坡法
?
最陡爬坡法是常用的非线性最优化数值方法 之一。 最陡爬坡法的基本思路是:从一个初始参数
?
值出发,在一个给定半径的圆周上找目标函 数最大(或最小)的一组参数值,然后再以 该组参数值为出发点重复上述搜索过程,直 至收敛。
3.迭代线性化方法
?
参数的初始值的非线性方程线性化,然后用OLS估计 线性化方程,并且调整最初选取的参数值。经过调整 的参数值可用来再次线性化该模型,然后再一次用 OLS进行估计,重新调整估计值,继续这个过程直到 最后一组迭代中得到的估计值没有实质性变化。 将非线性方程线性化的主要技巧是微积分中的泰勒级 数展开。 高斯-牛顿迭代法和牛顿-拉夫森迭代法
?
?
(1)高斯-牛顿法
?
该方法是常用的非线性最优化迭代算法之一,其基本 思路是:非线性最小二乘估计的问题在于最小二乘函 数 S (β) 中的
f,也就是回归模型 Y ? f (X, β) ? ε 的趋势部分不是参数向量的线性函数,因此最优化问
题
?1 , , ? p
? ? min S (β) ? [Y ? f ( X , β)]?[Y ? f ( X , β)] ? ?
需要新的求解方法。
?
?
?
当f是连续可微时,可以在某组参数初始值处作一阶泰 勒级数展开,得到f的线性近似,把这个线性近似函数 代入最小二乘函数得到参数的二次函数,克服参数估 计计算的困难。 但一阶泰勒级数展开得到的近似函数与原函数是有差 异的,用上述级数展开近似的方法得到的参数估计也 有偏差,偏差程度与泰勒级数展开的初始值与参数真 实值的偏差相关。 提高参数估计准确程度的途径是改进泰勒级数展开的 初始值,方法是把已经得到的参数估计作为新的参数 初始值,重新进行泰勒级数展开和参数估计。这种方 法可以反复运用,直到得到比较理想的参数估计值。 这种计算非线性回归参数估计的迭代算法称为“高斯 -牛顿法”。
?
在非线性回归分析中,高斯-牛顿法实质上就是非线 性模型本身的反复线性化和线性回归,适用对象是不 能通过初等数学变换转化为线性模型,但具有连续可 微函数性质,可以利用一阶泰勒级数展开强制转换成 线性模型的非线性模型。
4.牛顿一拉夫森法
?
这种方法可以看作是高斯—牛顿法改进方法的非线性 回归迭代算法,称为牛顿—拉夫森法(newton- raphson method)。 牛顿—拉夫森法的基本思想也是利用泰勒级数展开近
?
似,通过迭代运算寻找最小二乘函数最优解的数值解 法。
?
不过牛顿—拉夫森法不是对模型非线性函数f本身做线 性近似,而是直接对最小二乘函数最优化的一阶条件 做一阶泰勒级数展开近似。
?
?
牛顿—拉夫森方法的缺点是迭代运算中需要 反复计算梯度向量,特别是海塞矩阵的逆矩 阵,因此计算工作量很大。 高斯-牛顿法、牛顿-拉夫森法和其他各种 非线性回归参数估计方法,都包含迭代搜索 过程。这些迭代搜索法并没有严格的优劣关 系
?
?
有些方法可能收敛要好一些,收敛速度较快,但另一 些方法则计算量较小。有时候一种算法不收敛,而另 一种算法却能轻易找出最有解,甚至在理论上相当不 严密的方法有时候也可能相当有效,而且我们往往无 法知道一种方法之所以有效的实际原因,也很难事先 知道对于某个具体问题究竟哪种方法最有效。 因此在大多数情况下,尝试不同的迭代搜索方法通常 是有价值的。
三、非线性回归评价和假设检验
?
非线性回归在得到参数估计值和回归方程以后,也必 须对回归结果和模型假设的正确性进行评价和判断。 评判非线性回归
的基本思路也包括回归拟合度评价, 以及模型总体和参数显著性检验等。 非线性模型参数的显著性检验常常隐含模型非线性性
?
的检验。由于即使非线性回归模型的误差项有好的性 质,参数估计量也不具备BLUE估计等理想性质,因 此对非线回归的评价和检验,除了不涉及参数估计量 分布性质的决定系数以外,一般要麻烦一些,而且可 靠性较差。
1.判决系数
判决系数不涉及参数估计量的分布性质,也不需要做以这些分 布性质为基础的假设检验,因此非线性导致的问题并不影响该 统计量在评价回归方程拟合度方面的作用,仍然是评价非线性 模型合理程度的基本指标,或者说最重要的基本指标之一。 它们在非线性回归分析中的使用方法仍然是与在线性回归分析中 相同的。
R2 ? 1 ?
(Yi ? Y )2 ?
ui2 ??
2.t检验和总体显著性F检验
?
?
一般在线性回归分析中检验参数显著性的标准的检验 方法,以及用于评价线性回归总体显著性的F统计量, 在非线性回归中都会遇到困难。 2 因为我们无法利用回归残差得到误差项方差 ? 的无偏 估计。即使非线性模型的误差项 ε 服从0均值的正态 分布,非线性回归的参数估计量,以及残差: ? ? ei ? Yi ? f ( X1 i , , X K i ; ?1 , , ? P ) 也不像在线性回归中的参数估计和回归残差那样服从 ? 2分布,参数估计 正态分布,因此残差平方和不服从 量不服从正态分布,所以标准的t检验和F检验都无法 应用。
?
对于参数估计运用高斯-牛顿法的非线性回归时,可以把 线性回归的t和F检验应用到上述迭代过程中的最后一次线 性近似式。 一般来说,经过反复迭代从而得到的线性化模型应该能提 供非线性模型的一个比较好的近似,因此用对最后的线性 近似模型的检验替代对非线性模型本身的检验是有合理性 的。
事实上,运用线性化方法的非线性估计的计算机程序,通 常会计算最后一次线性化的t统计量、F统计量等指标。
?
?
?
此外,虽然非线性回归参数估计没有线性回归参数估 计的性质,但由参数估计值构造的相似的t统计量在大 样本时,还是渐近服从t分布的。 因此如果利用上述线性近似最后一次迭代得到的残差 标准差作为非线性回归误差项方差的近似,也能利用 该统计量进行参数的显著性检验,或者参数取特定值 得假设检验。
?
3.参数显著性的F检验
?
?
除了对高斯-牛顿法非线性回归可以利用最后一次线 性近似函数线性回归的t检验以外,检验非线性模型参 数的显著性还有多种其他方法。 下面这个渐近F分布的统计量就是其中的一种方法,即 [ S (β R ) ? S (β)] / g F (g, n ? k ) ? S
(β) /( n ? k ) 这个统计量分子、分母中β 的是未对非线性模型参数 施加约束时的参数估计, 则是对模型的某些参数施 β S 加0假设约束后的参数估计, (β) 和S (βR )分别是对应两 种参数估计的残差平方和,g是0约束参数的数量。
?
很显然,如果施加0约束的参数本身对模型的影 响没有显著性,那么上述F统计量的数值会很小 ,如果这些施加0约束的参数对模型的影响是明 显的,那么该统计量的数值会较大,就会有显著 性。因此,我们可以通过检验该统计量的显著性 来判断模型参数的显著性。
?
?
虽然上述F统计量与线性回归模型的F统计量形式是相 似的,但因为模型是非线性的,因此 S (βR ) S (β) 和 2 并不服从 ? 分布,该统计量并不严格服从F分布,只 是近似服从F分布。在样本容量较大时,该统计量的分 布与F分布很接近。 我们可以利用F分布检验该统计量的显著性,但检验结 果论的准确程度会受到一定影响,运用时应该加以注 意。
4.似然比检验
?
?
似然比检验与检验在本质上是另一种非线性模型参数 显著性检验。 似然比检验的统计量为 L(β R ) ? ? ?2(ln L(β R ) ? ln L(β)) ? ?2 ln L(β)
L( 式中 β 与 β R 的含义与上述F检验统计量中同,β)与 L(βR )则分别是它们各自对应的非线性模型被解释变量的似 然函数值。 ? 似然函数即随机变量得到特定观测值序列的联立分布 概率密度函数。
?
我们假设非线性模型的误差项服从均值为0的正态分布,那么上 述统计量中的对数似然函数为
n? ? e?e ? ? ln L(β) ? ? ?1 ? ln(2? ) ? ln ? ?? 2? ? n ??
?
式中,e是残差向量。如果参数估计采用的是最大似然估计,那 e ?e 么其中的 实际上就是误差方差的估计。 n 相应的有约束时,模型的对数似然函数为
?
因此,统计量
n? ? e? eR ln L(β R ) ? ? ?1 ? ln(2? ) ? ln ? R 2? ? n
?
为
?? ?? ??
? e?e ? ? ? e?e ? ? e?Re R ? ? ? ? n ? ln ? ? ? ln ? ? ? ? n ln ? ? ? ? n ?? ? ? n ? ? e Re R ?
?
?
对于大样本来说,该统计量渐近服从自由度为约束数 2 2 分布,因此可以根据 ? 分布检验 量g的 ? 2 的显著性。当该统计量比给定显著水平的 ? 分布 ? 临界值大时,拒绝0假设,认为所检验的参数是显著的 ,否则认为检验的参数是不显著的。 除了上述检验方法以外,非线性回归还有其他一些检 验方法,如沃尔德检验和拉格朗日乘数检验。多数方 法在本质上都是相似的。
面板数据
?
?
面板数据(Panel Data)又称纵列数据(Longitudinal Data),是指不同的横截面个体在不同的时间上的观 测值的
集合。从水平看,它包括了某一时间上的不同 的横截面个体的数据;从纵向看,它包括了每一横截 面的时间序列数据。 面板数据模型与一般的横截面数据模型或时间序列模 型的区别在于模型中的变量有两个下角标,例如:
Yit ? β?Xit ? ? it ,
i ? 1, 2,..., N ; t ? 1, 2,..., T
?
?
其中的i代表了横截面个体,如个人、家庭、企业或国 家等,t代表时间。因此,N代表横截面的宽度,T代 表时间的长度。 随机误差项可以分解为:
?it ? ?i ? ?t ? uit
?
?
其中,?i (i ? 1, 2,..., N )表示横截面效应,它不随时间的 变动而变动,但却随着横截面个体的不同而不同; ?t (t ? 1, 2,..., T ) 表示时间效应,它对同一时间的横截 面个体是相同的,但却随着时间的变动而变动。
?
?
?
?
当假设式中的 ?i (i ? 1, 2,..., N ) 或 ?t (t ? 1, 2,..., T ) 是固 定的(未知)常数时,则相应的面板数据模型称为固 定效应模型。 分别对应横截面固定效应模型和时间固定效应模型及 双向固定效应模型。 当他们是一个随机变量而非固定的常数时,则相应的面 板数据模型称为随机效应模型。 横截面随机效应模型和时间随机效应模型及双向随机 效应模型。
面板数据模型
双向误差构成模型
单向误差构成模型
单向随机效应
单向固定效应
双
向 固 定 效 应
双
向 随 机 效 应
横
截 面 随 机 效 应
时
间 随 机 效 应
横
截 面 固 定 效 应
时
间 固 定 效 应
随机效应模型
固定效应模型
估计方法
?
? ?
最小二乘虚拟变量估计 广义最小二乘 估计 检验:约束检验F 设定检验
?
?
范文四:非线性回归模型报告
附件二:实验报告格式(首页)
山东轻工业学院实验报告 成绩 课程名称 指导教师
院(系) 专业班级 实验地点:2机房
学生姓名 学号 同组人
实验项目名称 非线性回归模型的线性化
一、 实验目的和要求
1、掌握 Eviews 中的常用函数及应用
2、掌握用 Eviews 非线性回归模型的线性化分析
3、在老师的指导下独立完成实验,并得到正确的结果。
二、 实验原理
Eviews 解决非线性回归模型线性化问题
三、 主要仪器设备、试剂或材料
Eviews软件、课本教材、电脑
四、 实验方法与步骤
1、
CREATE AB A 19801996
2、DATA GDP K L
3、输入数据
obs GDP K L 1980103.52461.67394.79 1981107.96476.32413.02 1982114.1499.13420.5 1983123.4527.22435.6 1984147.47561.02447.5 1985175.71632.11455.9 1986194.67710.51466.94 1987220780.12470.93 1988259.64895.66465.15 1989283.34988.65469.79 1990310.951075.37470.07 1991342.751184.58479.67 1992411.241344.14485.7 1993536.11688.02503.1 1994725.142221.42513 1995920.112843.48515.3 19961102.13364.34512 4、 GENR Y=LOG(GDP)
GENR X1=LOG(K)
GENR X2=LOG(L)
LS Y C X1X2
Dependent Variable:Y
Method:Least Squares Date:05/11/13Time:11:43 Sample:19801996
Included observations:17
Variable Coeffic
ient
Std.
Error
t-Statisti c Prob.
C -10.459
771.286923
-8.12773 80.0000
X1 1.0212
770.02940434.732300.0000
X2 1.4711
100.2392776.1481490.0000
R-squared 0.9986
08
Mean
dependent var
5.6001 96
Adjusted R-squared 0.9984
09
S.D. dependent
var
0.7499 74
S.E. of regression 0.0299
14
Akaike info
criterion
-4.0222 23
Sum squared resid 0.0125
28
Schwarz
criterion
-3.8751 85
Log likelihood 37.188F-statistic 5021.5
9083
Durbin-Watson stat 1.5691
65Prob(F-statistic)
0.0000 00
5、 view—actual , fitted,residual--actual , fitted,residual,graf
五、 实验数据记录、处理及结果分析
由上表回归分析结果,估计的回归方程为
Y=-10.4639+1.0211X1+1.4719X2
(-8.1304) (34.7271) (6.1513)
R2=0.9986F=5020.103DW=1.5683
1、经济意义检验
根据回归结果, 参数β
1
的估计量为 1.0211, 说明在其他变量不变的条件
下, 每多投入 1亿元, GDP 就会增加 1.0211亿元; 参数β
2
的估计量为 1.4719, 说明在其他变量不变的条件下,每多增加一万名就业人员,GDP 增加 1.4719亿元。
六、讨论、心得
通过这次实验, 我明白了 eviews 的使用方法, 运用 Eviews 对数据进行分 析,快速的建立回归模型,通过对实验结果的分析可清晰地了解各项统计检 验结果。在这过程中,图形分析与各项指标相结合更清楚的了解数据的特性。 比如散点图与可决系数相比较,可知道回归模型对数据的拟合程度。通过这 次试验,我进一步了解了计量经济学非线性回归模型的线性化和最小二乘估 计问题,理论与实践结合,理解了各项统计检验指标的内涵。
-
附件三:实验报告附页
山东轻工业学院实验报告(附页)
范文五:多项式回归、非线性回归模型
多项式回归、非线性回归模型
关键词:回归方程的统计检验、拟合优度检验、回归方程的显著性检验、F检验、回归系数的显著性检验、残差分析、一元多项式回归模型、一元非线性回归模型
一、回归方程的统计检验 1. 拟合优度检验
1. 概念介绍
SST总离差平方和total SSR回归平方和regression SSE剩余平方和error
R2?1?
?(y?(y
i?1i?1n
n
i
?i)?y
2
??(y?
n
i
?i)2
i
?i)2
?(y
i?1
i?1
n
i
?i)2
2. 例题1
存在四点(-2,-3)、(-1,-1)、(1,2)、(4,3)求拟合直线与决定系数。
2. 回归方程的显著性检验
??(y
F?
i?1in
i
?i)2
?
?(y
i?1
n
?i)2/(n?2)?y
SSA
SSE/(n?2)
例6(F检验)
在合金钢强度的例1中,我们已求出了回归方程,这里考虑关于回归方程的显著性检验,经计算有:
表5 X射线照射次数与残留细菌数的方差分析表
这里值很小,因此,在显著性水平0.01下回归方程是显著的。 3. 回归系数的显著性检验 4. 残差分析
二、一元多项式回归模型
模型如以下形式的称为一元多项式回归模型:
y?anxn?an?1xn?1???a1x?a0
例1(多项式回归模型)
为了分析X射线的杀菌作用,用200千伏的X射线来照射细菌,每次照射6分钟,用平板计数法估计尚存活的细菌数。照射次数记为t,照射后的细菌数为y见表1。试求:
(1)给出y与t的二次回归模型。
(2)在同一坐标系内作出原始数据与拟合结果的散点图。 (3)预测t?16时残留的细菌数。
(4)根据问题的实际意义,你认为选择多项式函数是否合适?
表1 X射线照射次数与残留细菌数
程序1 t=1:15;
y=[352 211 197 160 142 106 104 60 56 38 36 32 21 19 15]; p=polyfit(t,y,2)%作二次多项式回归 y1=polyval(p,t);%模型估计与作图
plot(t,y,'-*',t,y1,'-o');%在同一坐标系中做出两个图形 legend('原始数据','二次函数') xlabel('t(照射次数)')%横坐标名 ylabel('y(残留细菌数)')%纵坐标名 t0=16;
yc1=polyconf(p,t0)%预测t0=16时残留的细菌数,方法1 yc2=polyval(p,t0)%预测t0=16时残留的细菌数,方法2 即二次回归模型为:
y1?1.9897t2?51.1394t?347.8967
y(残留细菌数)
05
t(照射次数)
1015
图1 原始数据与拟合效果的散点图
原始数据与拟合结果的散点图如图所示,从图形可知拟合效果较好。照射16次后,用二次函数计算出细菌残留数为39.0396,显然与实际不符。由实际问题的意义可知,尽管二次多项式拟合效果较好,但是用于预测并不理想。因此如何根据原始数据散点图的规律,选择适当的回归曲线是非常重要的,这样就有必要给出非线性回归模型。
三、一元非线性回归模型
为了便于正确选择合适的函数进行回归分析建模,我们给出通常选择的6类曲线: (1)双曲线
1b
?a?(如图所示) yx
b
(2)幂函数曲线y?ax,其中x?0,a?0(如图所示)
(3)指数曲线y?aebx,其中参数a?0(如图所示) (4)倒指数曲线y?aeb/x,其中a?0(如图所示) (5)对数曲线y?a?blnx(如图所示) (6)S型曲线y?
1
,其中ab?0(如图所示)
a?be?x
非线性回归建模通常有两种方法:一是通过适当的变换转化为线性回归模型,例如双曲线模型
111b
,如果作变换y??,x??则有y??a?bx?,此时就?a?(如图1所示)
xyyx
是线性回归模型。如果无法实现线性化,可以利用最小二乘法直接建立非线性回归模型,求解最佳参数。
例2(非线性回归模型、置信区间)
炼钢厂出钢时所用盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增大,我们希望找出使用次数与增大容积之间的函数关系。实验数据见表2。
(1)建立非线性回归模型
1b?a?; yx
(2)预测钢包使用x0?17次后增大的容积y0; (3)计算回归模型参数的置信度为95%的置信区间。
表2 钢包使用次数与增大容积
解:(1)建立非线性回归模型: 程序2 x=[2:16];
y= [6.42 8.2 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.6 10.8 10.6 10.9 10.76]; %建立非线性双曲线回归模型 b0=[0.084,0.1436];%回归系数初值
fun=inline('x./(b(1)*x+b(2))','b','x');%建立函数
[beta,r,J]=nlinfit(x,y,fun,b0);%非线性拟合命令;其中,beta表示最佳回归系数的估计值,r是残差,J是雅可比矩阵
beta%输出最佳参数
y1=x./(0.0845*x+0.1152);%拟合曲线 plot(x,y,'*',x,y1,'-or')
legend('原始数据','拟合曲线')%legend为图例命令
初始值要先计算后才能得到上面程序中的b0,选择已知程序中的点(2,6.42)和点(16,10.76),可选择手工方法解方程,也可利用以下MATLAB程序求解。
程序3
[a,b]=solve('1/6.42=a+b/2','1/10.76=a+b/16')%解方程
注:当所求解的方程过于复杂时,MATLAB运行会出现错误,此时需将方程尽量化简后再进行求解,如以下形式:
[a,b]=solve('6.42*(2*a+b)=2','10.76*(16*a+b)=16')
运行程序3可得到最佳参数为a?0.0845、b?0.1152,求解得到钢包使用次数与增大容积的非线性拟合图,如图2所示。
图2 钢包使用次数与增大容积的非线性拟合图
(2)预测钢包使用17次后增大的容积: 程序4
ypred=nlpredci(fun,17,beta,r,J)%预测钢包使用17次后增大的容积 (3)置信区间: 程序5
ci=nlparci(beta,r,J)%置信区间 运行后得到 ci =
0.0814 0.0876 0.0934 0.1370
即回归模型中参数的置信度为的置信区间分别为[0.0814,0.0876]与[0.0934,0.1370]。我们求出的最佳参数分别为a?0.0845和b?0.1152,均属于上述置信区间。
调用多项式回归的GUI界面,可显示出钢包使用次数与增大容积的拟合交互图,见图3。 程序6 polytool(x,y,2)
图2 钢包使用次数与增大容积的非线性拟合图
(2)预测钢包使用17次后增大的容积:
程序4
ypred=nlpredci(fun,17,beta,r,J)%预测钢包使用17次后增大的容积
(3)置信区间:
程序5
ci=nlparci(beta,r,J)%置信区间
运行后得到
ci =
0.0814 0.0876
0.0934 0.1370
即回归模型中参数的置信度为的置信区间分别为[0.0814,0.0876]与[0.0934,0.1370]。我们求出的最佳参数分别为a?0.0845和b?0.1152,均属于上述置信区间。
调用多项式回归的GUI界面,可显示出钢包使用次数与增大容积的拟合交互图,见图3。 程序6
polytool(x,y,2)
图3 钢包使用次数与增大容积的拟合交互图
图中的星号代表实验的原始数据点,绿色实线是回归模型曲线,两条红色虚线为95%上下置信区间的曲线,纵向的虚线表示自变量为9时,横向虚线对应的预测值为10.4118。
转载请注明出处范文大全网 » 非线性回归模型有哪些非线性回