范文一:amos 结构方程模型分析
, Amos模型设定操作
在使用AMOS进行模型设定之前,建议事先在纸上绘制出基本理论模型和变量影响关系路径图,并确定潜变量与可测变量的名称,以避免不必要的返工。
1. 绘制潜变量
使用建模区域绘制模型中的潜变量,在潜变量上点击右键选择Object Properties,为潜变量命名。
2. 为潜变量设置可测变量及相应的残差变量
使用绘制。在可测变量上点击右键选择Object Properties为可测变量命名。其中Variable Name对应的是数据的变量名,在残差变量上右键选择Object Properties为残差变量命名。
3. 配置数据文件,读入数据
File——Data Files——File Name——OK。
4. 模型拟合
View——Analysis Properties——Estimation——Maximum Likelihood。
5. 标准化系数
Analysis Properties——Output——Standardized Estimates——因子载荷标准化系数。
6. 参数估计结果
Analyze——Calculate Estimates。红色框架部分是模型运算基本结果信息,点击View the Output Path Diagram查看参数估计结果图。
7. 模型评价
点击查看AMOS路径系数或载荷系数以及拟合指标评价。
路径系数/载荷系数的显著性
模型评价首先需要对路径系数或载荷系数进行统计显著性检验。
模型拟合指数
模型拟合指数是考察理论结构模型对数据拟合程度的统计指标。拟合指数的作用是考察理论模型与数据的适配程度,并不能作为判断模型是否成立的唯一依据。拟合优度高的模型只能作为参考,还需要根据所研究问题的背景知识进行模型合理性讨论。
1指数名称 评价标准
2绝对拟合指数 (卡方) 越小越好 ,
GFI 大于0.9
RMR 、SRMR、 RMSEA 小于0.05,越小越好
相对拟合指数 NFI 、TLI、CFI 大于0.9,越接近1越好
信息指数 AIC、 CAIC 越小越好
8. 模型修正
模型修正的思路
当模型效果很差时可以参考模型修正指标对模型进行模型扩展(Model Building)或模型限制(Model Trimming) ,其中修正指数(Modification Index)用于模型扩展,临界比率(Critical Ratio)用于模型限制。模型扩展是指通过释放部分限制路径或添加新路径,使模型结构更加合理,通常在提高模型拟合程度时使用;模型限制是指通过删除或限制部分路径,使模型结构更加简洁,通常在提高模型可识别性时使用。
修正指数(Modification Index)。若要使用修正指数,需要在Analysis Properties——Output——Modification Indices。Threshold for Modification Indices指的是输出的开始值。
临界比率(Critical Ratio)。若要使用临界比率,需要在Analysis Properties——Output——Critical Ratio for Difference。
9. 模型解释
输出模型的直接效应、间接效应以及总效应,Analysis Properties——Output——Indirect , Direct
&Total Effects。
范文二:stata 做结构方程模型
?
Statistics/Data Analysis
If you are new to sem , see
If you are already familiar with sem , the following help files are useful:
sem command syntax, path notation, and graphical interface
Command syntax for path diagrams
Types of options affecting the SEM model
Model description options
Options affecting interpretation of syntax
Further information on specific options affecting the SEM model
Specifying starting values
Specifying method and calculation of VCE
Using sem with summary statistics data
Postestimation commands
Postestimation tools for sem
Tests for invariance of parameters across groups Score tests
indirect
Linear combinations of parameters
Likelihood?ratio test of linear hypothesis Factor scores, linear predictions, etc. Wald test of nonlinear hypotheses
Other
范文三:amos_验证性因子分析结构方程建模步步教程
应用案例 1
第一节 模型设定
结构方程模型分析过程可以分为模型构建、模型运算、模型修正以及模型解 释四个步骤。下面以一个研究实例作为说明,使用 Amos7软件 2进行计算,阐述 在实际应用中结构方程模型的构建、运算、修正与模型解释过程。
一、 模型构建的思路
本案例在著名的美国顾客满意度指数模型 (ASCI)的基础上, 提出了一个新的 模型, 并以此构建潜变量并建立模型结构。 根据构建的理论模型, 通过设计问卷 对某超市顾客购物服务满意度调查得到实际数据, 然后利用对缺失值进行处理后 的数据 3进行分析,并对文中提出的模型进行拟合、修正和解释。
二、 潜变量和可测变量的设定
本文在继承 ASCI 模型核心概念的基础上,对模型作了一些改进,在模型中 增加超市形象。 它包括顾客对超市总体形象及与其他超市相比的知名度。 它与顾 客期望,感知价格和顾客满意有关,设计的模型见表 7-1。
模型中共包含七个因素 (潜变量 ) :超市形象、质量期望、质量感知、感知价 值、顾客满意、顾客抱怨、顾客忠诚,其中前四个要素是前提变量,后三个因素 是结果变量,前提变量综合决定并影响着结果变量 (Eugene W. Anderson & Claes Fornell , 2000; 殷荣伍, 2000) 。
1关于该案例的操作也可结合书上第七章的相关内容来看。
2本案例是在 Amos7中完成的。
3见 spss 数据文件“处理后的数据 .sav ” 。
2.1、顾客满意模型中各因素的具体范畴
参考前面模型的总体构建情况、 国外研究理论和其他行业实证结论, 以及小 范围甄别调查的结果,模型中各要素需要观测的具体范畴,见表 7-2。
三、 关于顾客满意调查数据的收集
本次问卷调研的对象为居住在某大学校内的各类学生 (包括全日制本科生、 全日制硕士和博士研究生) ,并且近一个月内在校内某超市有购物体验的学生。 调查采用随机拦访的方式, 并且为避免样本的同质性和重复填写, 按照性别和被 访者经常光顾的超市进行控制。问卷内容包括 7个潜变量因子, 24项可测指标,
4正向的,采用 Likert10级量度从“非常低”到“非常高”
本次调查共发放问卷 500份,收回有效样本 436份。
四、 缺失值的处理
采用表列删除法,即在一条记录中,只要存在一项缺失,则删除该记录。最 终得到 401条数据,基于这部分数据做分析。
五、 数据的的信度和效度检验
1.数据的信度检验
信度(reliability )指测量结果(数据)一致性或稳定性的程度 。一致性主要 反映的是测验内部题目之间的关系, 考察测验的各个题目是否测量了相同的内容 或特质。 稳定性是指用一种测量工具 (譬如同一份问卷) 对同一群受试者进行不 同时间上的重复测量结果间的可靠系数。 如果问卷设计合理, 重复测量的结果间 应该高度相关。 由于本案例并没有进行多次重复测量, 所以主要采用反映内部一 致性的指标来测量数据的信度。
折半信度(split-half reliability)是将测量工具中的条目按奇偶数或前后分成 两半, 采用 Spearman-brown 公式估计相关系数, 相关系数高提示内部一致性好。 然而,折半信度系数是建立在两半问题条目分数的方差相等这一假设基础上的, 但实际数据并不一定满足这一假定,因此信度往往被低估。 Cronbach 在 1951年 提出了一种新的方法(Cronbach's Alpha系数 ) , 这种方法将测量工具中任一条目 结果同其他所有条目作比较, 对量表内部一致性估计更为慎重, 因此克服了折半 信度的缺点。本章采用 SPSS16.0研究数据的内部一致性。在 Analyze 菜单中选 择 Scale 下的 Reliability Analysis (如图 7-1) ,将数据中在左边方框中待分析的 24个题目一一选中,然后点击 ,左边方框中待分析的 24个题目进入右边的 items 方框中,使用 Alpha 模型(默认) ,得到图 7-2,然后点击 ok 即可得到如表 7-3的结果, 显示 Cronbach's Alpha系数为 0.892, 说明案例所使用数据具有较好 的信度。
图 7-1 信度分析的选择
图 7-2 信度分析变量及方法的选择
7-4所示 5。从表 7-4可以看到,除顾客抱怨量表 Cronbaca ’ s Alpha 系数为 0.255,比较低以外,其它 分量表的 Alpha 系数均在 0.7以上,且总量表的 Cronbach ’ s Alpha 系数达到了 0.891,表明此量表的可靠性较高。由信度检验的结果可知顾客抱怨的测量指标 的信度远低于 0.7,因此在路径图中去掉顾客抱怨因子,即初始模型中包括 6个 潜变量、 21个可测变量。
表 7-4 潜变量的信度检验
质量期望 5 0.889
质量感知 5 0.862
感知价格 2 0.929
顾客满意 3 0.948
顾客抱怨 3 0.255
顾客忠诚 3 0.738
2.数据的效度检验
效度 (validity ) 指测量工具能够正确测量出所要测量的特质的程度, 分为内 容效度(content validity ) 、效标效度(criterion validity )和结构效度(construct validity )三个主要类型。
内容效度也称表面效度或逻辑效度 , 是指测量目标与测量内容之间的适合性 与相符性。 对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。 逻辑
5操作过程同前,不同的是在图 7-14中选入右边方框 items 中是相应潜变量对应的题目。如对超市形象潜变 量,只需要把 a1、 a2和 a3题目选入到右边方框 items 中即可。
分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。
准则效度又称效标效度、实证效度、统计效度、预测效度或标准关联效度, 是指用不同的几种测量方式或不同的指标对同一变量进行测量, 并将其中的一种 方式作为准则(效标) ,用其他的方式或指标与这个准则作比较,如果其他方式 或指标也有效,那么这个测量即具备效标效度。例如, X 是一个变量,我们使用
1X 、 2X 两种工具进行测量。如果使用 1X 作为准则,并且 1X 和 2X 高度相关,我们就
说 2X 也是具有很高的效度。 当然, 使用这种方法的关键在于作为准则的测量方式 或指标一定要是有效的, 否则越比越差。 现实中, 我们评价效标效度的方法是相 关分析或差异显著性检验, 但是在调查问卷的效度分析中, 选择一个合适的准则 往往十分困难,也使这种方法的应用受到一定限制。
结构效度也称构想效度、 建构效度或理论效度 , 是指测量工具反映概念和命 题的内部结构的程度, 也就是说如果问卷调查结果能够测量其理论特征, 使调查 结果与理论预期一致, 就认为数据是具有结构效度的。 它一般是通过测量结果与 理论假设相比较来检验的 。确定结构效度的基本步骤是,首先从某一理论出发, 提出关于特质的假设, 然后设计和编制测量并进行施测, 最后对测量的结果采用 相关分析或因子分析等方法进行分析,验证其与理论假设的相符程度。
在实际操作的过程中, 前面两种效度 (内容效度和准则效度) 往往要求专家 定性研究或具有公认的效标测量, 因而难以实现的, 而结构效度便于可以采用多 种方法来实现:
第一种方法是通过模型系数评价结构效度。 如果模型假设的潜变量之间的关 系以及潜变量与可测变量之间的关系合理, 非标准化系数应当具有显著的统计意
义。特别地,通过标准化系数 6
可以比较不同指标间的效度。从表 7-17可以看出 在 99%的置信度下所有非标准化系数具有统计显著性, 这说明修正模型的整体结 构效度较好。
第二种方法是通过相关系数评价结构效度。 如果在理论模型中潜变量之间存 在相关关系, 可以通过潜变量的相关系数来评价结构效度:显著的相关系数说明 理论模型假设成立,具有较好的结构效度。
第三种方法是 先构建理论模型, 通过验证性因子分析的模型拟合情况来对量 表的结构效度进行考评 。 因此数据的效度检验就转化为结构方程模型评价中的模 型拟合指数评价。对于本案例,从表 7-16可知理论模型与数据拟合较好,结构 效度较好。
六、 结构方程模型建模 构建如图 7.3的初始模型。
6
关于标准化系数的解释见本章第五节。
图 7-3 初始模型结构
图 7-4 Amos Graphics初始界面图
第二节 Amos 实现 7
7
这部分的操作说明也可参看书上第七章第二节 :Amos实现。
一、 Amos 基本界面与工具
打开 Amos Graphics, 初始界面如图 7-4。 其中第一部分是建模区域, 默认是 竖版格式。如果要建立的模型在横向上占用较大空间,只需选择 View 菜单中的 Interface Properties选项下的 Landscape (如图 7.5) ,即可将建模区域调整为横板 格式。
图 7-2中的第二部分是工具栏,用于模型的设定、运算与修正。相关工具的 具体功能参见书后附录二。
图 7-5 建模区域的版式调整
图 7-6 建立潜变量
二、 Amos 模型设定操作
1.模型的绘制
在使用 Amos 进行模型设定之前,建议事先在纸上绘制出基本理论模型和 变量影响关系路径图,并确定潜变量与可测变量的名称,以避免不必要的返工。 相关软件操作如下:
第一步,使用 建模区域绘制模型中的七个潜变量(如图 7-6) 。为了保持图 形的美观, 可以使用先绘制一个潜变量, 再使用复制工具 绘制其他潜变量, 以 保证潜变量大小一致。在潜变量上点击右键选择 Object Properties ,为潜变量命 名(如图 7-7) 。绘制好的潜变量图形如图 7-8。
第二步设置潜变量之间的关系。使用
来设置变量间的因果关系,使用
来设置变量间的相关关系。绘制好的潜变量关系图如图 7-9。
图 7-7 潜变量命名
图 7-8 命名后的潜变量
图 7-9 设定潜变量关系
第三步为潜变量设置可测变量及相应的残差变量, 可以使用 绘制, 也可
以使用
和 自行绘制(绘制结果如图 7-10) 。在可测变量上点击右键选择 Object Properties,为可测变量命名。其中 Variable Name一项对应的是数据中的 变量名(如图 7-11) ,在残差变量上右键选择 Object Properties为残差变量命名。 最终绘制完成模型结果如图 7-12。
图 7-10 设定可测变量及残差变量
图 7-11 可测变量指定与命名
图 7-12 初始模型设置完成
2.数据文件的配置
Amos 可以处理多种数据格式, 如文本文档 (*.txt) , 表格文档 (*.xls、 *.wk1) , 数据库文档(*.dbf、 *.mdb) , SPSS 文档(*.sav)等。
为了配置数据文件,选择 File 菜单中的 Data Files (如图 7-13) ,出现如图 7-14左边的对话框,然后点击 File name按钮,出现如图 7-14右边的对话框,找 到需要读入的数据文件“处理后的数据 .sav ” , 双击文件名或点击下面的“打开” 按钮,最后点击图 7-14左边的对话框中“ ok ”按钮,这样就读入数据了。
图 7-13 数据配置
图 7-14 数据读入
第三节 模型拟合
一、 参数估计方法选择
模型运算是使用软件进行模型参数估计的过程。 Amos 提供了多种模型运算 方法供选择 8。可以通过点击 View 菜单在 Analysis Properties
(或点击工具栏的
)中的 Estimation 项选择相应的估计方法。
本案例使用最大似然估计(Maximum Likelihood)进行模型运算,相关设置 如图 7-15。
图 7-15 参数估计选择
二、 标准化系数
如果不做选择,输出结果默认的路径系数(或载荷系数)没有经过标准化, 8详细方法列表参见书后附录一。
称作非标准化系数。 非标准化系数中存在依赖于有关变量的尺度单位, 所以在比 较路径系数(或载荷系数)时无法直接使用,因此需要进行标准化。在 Analysis Properties 中的 Output 项中选择 Standardized Estimates项 (如图 7-26) , 即可输出 测量模型的因子载荷标准化系数如表 7-5最后一列。
图 7.16 标准化系数计算
标准化系数是将各变量原始分数转换为 Z 分数 9后得到的估计结果,用以度 量变量间的相对变化水平。
因此不同变量间的标准化路径系数(或标准化载荷系数)可以直接比较。从表 7-17最后一列中可以看出:受“质量期望”潜变量影响的是“质量感知”潜变 量和“感知价格”潜变量;标准化路径系数分别为 0.434和 0.244,这说明“质 量期望”潜变量对“质量感知”潜变量的影响程度大于其对“感知价格”潜变量 的影响程度。
三、 参数估计结果的展示 9Z 分数转换公式为:i i X X Z s -
-=。
图 7-17 模型运算完成图
使用 Analyze 菜单下的 Calculate Estimates 进行模型运算(或使用工具栏中 的 ) ,输出结果如图 7-17。其中红框部分是模型运算基本结果信息,使用者 也可以通过点击 View the output path diagram(
)查看参数估计结果图(图
7-18) 。
图 7-18 参数估计结果图
Amos
还提供了表格形式的模型运算详细结果信息,通过点击工具栏中的
来查看。详细信息包括分析基本情况(Analysis Summary) 、变量基本情况
(Variable Summary) 、模型信息(Notes for Model) 、估计结果(Estimates ) 、修 正指数(Modification Indices)和模型拟合(Model Fit)六部分。 在分析过程中, 一般通过前三部分 10了解模型, 在模型评价时使用估计结果和模型拟合部分, 在 模型修正时使用修正指数部分。
四、 模型评价
1.路径系数 /载荷系数的显著性
参数估计结果如表 7-5到表 7-6, 模型评价首先要考察模型结果中估计出的 参数是否具有统计意义,需要对路径系数或载荷系数 11进行统计显著性检验 ,这 类似于回归分析中的参数显著性检验,原假设为系数等于。 Amos 提供了一种简 单便捷的方法,叫做 CR (Critical Ratio ) 。 CR 值是一个 Z 统计量,使用参数估 计值与其标准差之比构成(如表 7-5中第四列) 。 Amos 同时给出了 CR 的统计检 验相伴概率 p (如表 7-5中第五列) ,使用者可以根据 p 值进行路径系数 /载荷系 数的统计显著性检验。譬如对于表 7.5中“超市形象”潜变量对“质量期望”潜 变量的路径系数(第一行)为 0.301,其 CR 值为 6.68,相应的 p 值小于 0.01, 则可以认为这个路径系数在 95%的置信度下与 0存在显著性差异。
表 7-5 系数估计结果
未标准化 路径系数 标准化 路径系
望 <--- 象="" 0.301="" 0.045="" 6.68="" ***="" par_16="">--->
质量感 知 <--->--->
望 0.434 0.057 7.633 *** par_17 0.434
感知价 格 <--->--->
望 0.329 0.089 3.722 *** par_18 0.244
感知价 格 <--->--->
知 -0.121 0.082 -1.467 0.142 par_19 -0.089
感知价 格 <--->--->
象 -0.005 0.065 -0.07 0.944 par_20 -0.004
顾客满 意 <--->--->
象 0.912 0.043 21.389 *** par_21 0.878
顾客满 意 <--->--->
格 -0.029 0.028 -1.036 0.3 par_23 -0.032
顾客忠 诚 <--->--->
象 0.167 0.101 1.653 0.098 par_22 0.183
顾客忠 诚 <--->--->
意 0.5 0.1 4.988 *** par_24 0.569
a112<--- 超市形="" 1="">--->
10分析基本情况(Analysis Summary) 、变量基本情况(Variable Summary) 、模型信息(Notes for Model)三 部分的详细介绍如书后附录三。
11潜变量与潜变量间的回归系数称为路径系数;潜变量与可测变量间的回归系数称为载荷系数。
12凡是 a+数字的变量都是代表问卷中相应测量指标的,其中数字代表的问卷第一部分中问题的序号。
象
a2 <--->--->
象 1.008 0.036 27.991 *** par_1 0.899
a3 <--->--->
象 0.701 0.048 14.667 *** par_2 0.629
a5 <--->--->
望 1 0.79
a4 <--->--->
望 0.79 0.061 12.852 *** par_3 0.626
a6 <--->--->
望 0.891 0.053 16.906 *** par_4 0.786
a7 <--->--->
望 1.159 0.059 19.628 *** par_5 0.891
a8 <--->--->
望 1.024 0.058 17.713 *** par_6 0.816
a10 <--->--->
知 1 0.768
a9 <--->--->
知 1.16 0.065 17.911 *** par_7 0.882
a11 <--->--->
知 0.758 0.068 11.075 *** par_8 0.563
a12 <--->--->
知 1.101 0.069 15.973 *** par_9 0.784
a13 <--->--->
知 0.983 0.067 14.777 *** par_10 0.732
a18 <--->--->
意 1 0.886
a17 <--->--->
意 1.039 0.034 30.171 *** par_11 0.939
a15 <--->--->
格 1 0.963
a14 <--->--->
格 0.972 0.127 7.67 *** par_12 0.904
a16 <--->--->
意 1.009 0.033 31.024 *** par_13 0.95
a24 <--->--->
诚 1 0.682
a23 <--->--->
诚 1.208 0.092 13.079 *** par_14 0.846
注 :“ ***”表示 0.01 水平上显著,括号中是相应的 C.R 值,即 t 值。 表 7-6 方差估计
方差估计 S.E. C.R. P Label 超市形象 3.5740.29911.958***par_25 z22.2080.2439.08***par_26
z12.060.2418.54***par_27 z34.4050.6686.596***par_28 z40.8940.1078.352***par_29 z51.3730.2146.404***par_30 e10.5840.0797.363***par_31 e20.8610.0939.288***par_32 e32.6750.19913.467***par_33 e51.5260.1311.733***par_34 e42.4590.18613.232***par_35 e61.2450.10511.799***par_36 e70.8870.1038.583***par_37 e81.3350.11911.228***par_38 e101.7590.15211.565***par_39 e90.9760.1227.976***par_40 e113.1380.23513.343***par_41 e121.9260.17111.272***par_42 e132.1280.17612.11***par_43 e181.0560.08911.832***par_44 e160.420.0528.007***par_45 e170.5540.0619.103***par_46 e150.3640.5910.6160.538par_47 e243.4130.29511.55***par_48 e223.3810.28112.051***par_49 e231.730.2526.874***par_50 e140.9810.5621.7450.081par_51注 :“ ***”表示 0.01 水平上显著,括号中是相应的 C.R 值,即 t 值。
五、 模型拟合评价
在结构方程模型中, 试图通过统计运算方法 (如最大似然法等) 求出那些使 样本方差协方差矩阵 S 与理论方差协方差矩阵 ∑的差异最小的模型参数。 换一个 角度, 如果理论模型结构对于收集到的数据是合理的, 那么样本方差协方差矩阵 S 与理论方差协方差矩阵 ∑差别不大,即残差矩阵(S
∑-)各个元素接近于 0, 就可以认为模型拟合了数据。
模型拟合指数是考察理论结构模型对数据拟合程度的统计指标。 不同类别的 模型拟合指数可以从模型复杂性、 样本大小、 相对性与绝对性等方面对理论模型 进行度量。 Amos 提供了多种模型拟合指数(如表
13表格中给出的是该拟合指数的最优标准, 譬如对于 RMSEA , 其值小于 0.05表示模型拟合较好, 在 0.05-0.08间表示模型拟合尚可(Browne & Cudeck, 1993) 。因此在实际研究中,可根据具体情况分析。
7-7
标进行模型修正。
需要注意的是, 拟合指数的作用是考察理论模型与数据的适配程度, 并不能 作为判断模型是否成立的唯一依据。 拟合优度高的模型只能作为参考, 还需要根 据所研究问题的背景知识进行模型合理性讨论。 即便拟合指数没有达到最优, 但 一个能够使用相关理论解释的模型更具有研究意义。
第四节 模型修正 15
一、 模型修正的思路
模型拟合指数和系数显著性检验固然重要, 但对于数据分析更重要的是模型 结论一定要具有理论依据, 换言之, 模型结果要可以被相关领域知识所解释。 因 此,在进行模型修正时主要考虑修正后的模型结果是否具有现实意义或理论价 值,当模型效果很差时 16可以参考模型修正指标对模型进行调整。
当模型效果很差时,研究者可以根据初始模型的参数显著性结果和 Amos 提 供 的 模 型 修 正 指 标 进 行 模 型 扩 展 (Model Building ) 或 模 型 限 制 (Model Trimming ) 。 模型扩展 是指通过释放部分限制路径或添加新路径,使模型结构更 加合理,通常在提高模型拟合程度时使用; 模型限制 是指通过删除 17或限制部分 路径,使模型结构更加简洁,通常在提高模型可识别性时使用。
Amos 提供了两种模型修正指标,其中 修正指数(Modification Index )用于 模型扩展,临界比率(Critical Ratio) 18用于模型限制。
二、 模型修正指标 19
1. 修正指数(Modification Index)
14详细请参考 Amos 6.0 User’ s Guide 489项。
15关于案例中模型的拟合方法和模型修正指数详情也可参看书上第七章第三节和第四节。
16如模型不可识别,或拟合指数结果很差。
17譬如可以删除初始模型中不存在显著意义的路径。
18这个 CR 不同于参数显著性检验中的 CR ,使用方法将在下文中阐明。
19无论是根据修正指数还是临界比率进行模型修正,都要以模型的实际意义与理论依据为基础。
图 7-19 修正指数计算
修正指数用于模型扩展, 是指对于模型中某个受限制的参数, 若容许自由估 计(譬如在模型中添加某
条路径) ,整个模型改良时将会减少的最小卡方值 20。
使用修正指数修改模型时, 原则上每次只修改一个参数, 从最大值开始估算。 但在实际中,也要考虑让该参数自由估计是否有理论根据。
若 要 使 用 修 正 指 数 , 需 要 在 Analysis Properties 中 的 Output 项 选 择 Modification Indices项(如图 7-19) 。其后面的 Threshold for Modification Indices指的是输出的开始值 21。
20即当模型释放某个模型参数时,卡方统计量的减少量将大于等于相应的修正指数值。
21只有修正指数值大于开始值的路径才会被输出,一般默认开始值为 4。
图 7-20 临界比率计算
2. 临界比率 (Critical Ratio)
临界比率用于模型限制, 是计算模型中的每一对待估参数 (路径系数或载荷 系数)之差,并除以相应参数之差的标准差所构造出的统计量。在模型假设下, CR 统计量服从正态分布,所以可以根据 CR 值判断两个待估参数间是否存在显 著性差异。 若两个待估参数间不存在显著性差异, 则可以限定模型在估计时对这 两个参数赋以相同的值。
若要使用临界比率,需要在 Analysis Properties 中的 Output 项选择 Critical Ratio for Difference项(如图 7-20) 。
三、 案例修正
对本章所研究案例,初始模型运算结果如表 7-8,各项拟合指数尚可。但从
模型参数的显著性检验(如
表 7-5)中可发现可以看出,无论是关于感知价格的测量方程部分还是关于结构 方程部分(除与质量期望的路径外) ,系数都是不显著的。 关于感知价格的结构 方程部分的平方复相关系数为 0.048,非常小。另外,从实际的角度考虑,通过 自身的感受,某超市商品价格同校内外其它主要超市的商品价格的差别不明显, 因此, 首先考虑将该因子在本文的结构方程模型中去除, 并且增加质量期望和质 量感知到顾客满意的路径。 超市形象对顾客忠诚的路径先保留。 修改的模型如图 7-21。
表 7-8 常用拟合指数计算结果
拟合指 数 卡 方 值 (自 CFI NFI IFI RMSEA AIC BCC
EVCI (180)
图 7-21 修正的模型二
根据上面提出的图 7-21提出的所示的模型,在 Amos 中运用极大似然估计 运行的部分结果如表 7-9。
表 7-9 常用拟合指数计算结果
拟合指 卡 方 值 CFI NFI IFI RMSEA AIC BCC EVCI
(145)
从表 7-8和表 7-9可以看出,卡方值减小了很多,并且各拟合指数也都得到 了改善,但与理想的拟合指数值仍有差距。该模型的各个参数在 0.05的水平下 都是显著的,并且从实际考虑,各因子的各个路径也是合理存在的。
下面考虑通过修正指数对模型修正, 通过点击工具栏中的 来查看模型输 出详细结果中的 Modification Indices 项可以查看模型的修正指数(Modification Index )结果,双箭头(“ <-->” )部分是残差变量间的协方差修正指数,表示如果 在两个可测变量的残差变量间增加一条相关路径至少会减少的模型的卡方值; 单 箭头(“ <---” )部分是变量间的回归权重修正指数,表示如果在两个变量间增加="" 一条因果路径至少会减少的模型的卡方值。比如,超市形象到质量感知的="" mi="" 值="" 为="" 179.649,表明如果增加超市形象到质量感知的路径,则模型的卡方值会大大="" 减小。从实际考虑,超市形象的确会影响到质量感知,设想,一个具有良好品牌="" 形象的超市,人们难免会对感到它的商品质量较好;反之,则相反。因此考虑增="" 加从超市形象到质量感知的路径的模型如图="">---”>
根据上面提出的图 7-22所示的模型,在 Amos 中运用极大似然估计运行的 部分结果如表 7-10、表 7-11。
了改善,但与理想的拟合指数值仍有差距。
表 7-115%水平下不显著的估计参数
意 <--->--->
-.054 .035 -1.540 .124 par_22 顾客忠
诚 <--->--->
.164 .100 1.632 .103 par_21
图 7-22 修正的模型三
除上面表 7-11中的两个路径系数在 0.05的水平下不显著外,该模型其它各 个参数在 0.01水平下都是显著的,首先考虑去除 p 值较大的路径,即质量期望 到顾客满意的路径。重新估计模型,结果如表 7-12。
表 7-125%水平下不显著的估计参数
从表 7-12可以看出,超市形象对顾客忠诚路径系数估计的 p 值为 0.099,仍 大于 0.05。 并且从实际考虑, 在学校内部, 学生一般不会根据超市之间在形象上 的差别而选择坚持去同一个品牌的超市, 更多的可能是通过超市形象影响超市满 意等因素进而影响到顾客忠诚因素。考虑删除这两个路径的模型如图 7-23。 根据上面提出的如图 7-23所示的模型,在 AMOS 中运用极大似然估计运行 的部分结果如表 7-13。
表 7-13常用拟合指数计算结果
拟合指 卡方值 CFI NFI IFI RMSEA AIC BCC EVCI
改变,但模型便简单了,做此改变是值得的。该模型的各个参数在 0.01的水平 下都是显著的,另外质量感知对应的测量指标 a11(关于营业时间安排合理程度 的打分)对应方程的测定系数为 0.278,比较小,从实际考虑,由于人大校内东 区物美超市的营业时间从很长, 几乎是全天候营业在顾客心中, 可能该指标能用 质量感知解释的可能性不大,考虑删除该测量指标。修改后的模型如图 7-24。 根据上面提出的如图 7-24所示的模型,在 Amos 中运用极大似然估计运行 的部分结果如表 7-14。
表 7-14常用拟合指数计算结果
拟合指 数
卡方值
(自由度 )
CFI NFI IFI RMSEA AIC BCC EVCI
结果 401.3
(129)
0.951 0.930 0.951 0.073 485.291 489.480 1.213
从表 7-13和表 7-14可以看出,卡方值减小了很多,并且各拟合指数都得到 了较大的改善。该模型的各个参数在 0.01的水平下都仍然是显著的,各方程的 对应的测定系数增大了。
图 7-23 修正的模型四
图 7-24 修正的模型五
下面考虑通过修正指数对模型修正, e12与 e13的 MI 值最大,为 26.932, 表明如果增加 a12与 a13之间的残差相关的路径,则模型的卡方值会减小较多。 从实际考虑, 员工对顾客的态度与员工给顾客结帐的速度, 实际上也确实存在相 关, 设想, 对顾客而言, 超市员工结帐速度很慢本来就是一种对顾客态度不好的 方面;反之,则相反。因此考虑增加 e12与 e13的相关性路径。 (这里的分析不 考虑潜变量因子可测指标的更改, 理由是我们在设计问卷的题目的信度很好, 而 且题目本身的设计也不允许这样做,以下同。 )
重新估计模型,重新寻找 MI 值较大的, e7与 e8的 MI 值较大,为 26.230, (虽然 e3与 e6的 MI 值等于 26.746,但它们不属于同一个潜变量因子,因此不 能考虑增加相关性路径, 以下同) 表明如果增加 a7与 a8之间的残差相关的路径, 则模型的卡方值会减小较多。 这也是员工对顾客的态度与员工给顾客结帐的速度 之间存在相关,因此考虑增加 e7与 e8的相关性路径。
重新估计模型, 重新寻找 MI 值较大的, e17与 e18的 MI 值较大, 为 13.991, 表明如果增加 a17与 a18之间的残差相关的路径,则模型的卡方值会减小较多。 实际上消费前的满意度和与心中理想超市比较的满意度之间显然存在相关, 因此 考虑增加 e17与 e18的相关性路径。
重新估计模型,重新寻找 MI 值较大的, e2与 e3的 MI 值较大,为 11.088, 表明如果增加 a2与 a3之间的残差相关的路径, 则模型的卡方值会减小较多。 实 际上超市形象和超市品牌知名度之间显然存在相关, 因此考虑增加 e2与 e3的相 关性路径。
重新估计模型, 重新寻找 MI 值较大的, e10与 e12的 MI 值较大, 为 5.222, 表明如果增加 a10与 a12之间的残差相关的路径,则模型的卡方值会减小较多。 但实际上超市的食品保险 &日用品丰富性与员工态度之间显然不存在相关, 因此 不考虑增加 e10与 e12的相关性路径。 另外 , 从剩下的变量之间 MI 值没有可以做 处理的变量对了,因此考虑 MI 值修正后的模型如图 7-25。
图 7-25 修正的模型六
根据上面提出的如图 7-25所示的模型,在 Amos 中运用极大似然估计运行 的部分结果如表 7-15。
表 7-15常用拟合指数计算结果
拟合指 卡方值 CFI NFI IFI RMSEA AIC BCC EVCI
(125)
从表 7-14和表 7-15可以看出,卡方值减小了很多,并且各拟合指数都得到 了较大的改善。该模型的各个参数在 0.01的水平下都仍然是显著的,各方程的 对应的测定系数增大了。 下面考虑根据 Pairwise Parameter Comparisons来判断对 待估计参数的设定, 即判断哪些结构方程之间的系数没有显著差异, 哪些测量方 程的系数之间没有显著差异,哪些结构方程的随机项的方差之间没有显著差异, 哪些测量方程的随机项的方差之间的之间没有显著差异, 对没有显著差异的相应 参数估计设定为相等 , 直到最后所有相应的 critical ratio都大于 2为止。通过点击 工具栏中的 来查看模型输出详细结果中的 Pairwise Parameter Comparison项 可以查看临界比率(Critical Ratio)结果,其中 par_1到 par_46代表模型中 46个 待估参数,其含义在模型参数估计结果表(如表 7-5, 7-6)中标识。根据 CR 值 的大小 22,可以判断两个模型参数的数值间是否存在显著性差异。如果经检验发 现参数值间不存在显著性差异, 则可以考虑模型估计时限定两个参数相等。 如果 是某两个参数没有显著差异, 并且根据经验也是如此, 则可在相应的认为相等的 参数对应的路径或残差变量上点击右键选择 Object Properties, 然后出现如图 7-11的选项卡,选择 parameters 项,如
22一般绝对值小于 2认为没有显著差异。
图 7-26 对应因果路径
图 7-27 对应残差变量
图 7-28 对应相关系数路径
图 7-26,图 7-27,图 7-28。然后在 Regression weight23, variance 24, covariane 25输入 相同的英文名称即可。比如从图 7-25修正的模型六输出的临界比率结果中发现
23对应因果路径。
24对应残差变量。
25对应相关系数路径。
绝对值最小的是 par_44和 par_45对应的 -0.021,远远
图 7-29 设置 e22和 e24的方差相等
图 7-30 修正的模型七
小于 95%置信水平下的临界值,说明两个方差间不存在显著差异。对应的是 e22和 e24的方差估计,从实际考虑,也可以认为它们的方差相差,则残差变量 e22和 e24上点击右键选择 Object Properties, 出现如图 7-29的选项卡, 然后在 Object Properties 选项卡下面的 variance 中都输入“ v2” ,最后关掉窗口即可设置 e22和
e24的方差相等。经过反复比较得到的结构方程模型如图 7-30。
根据上面提出的如图 7-30所示的模型,在 Amos 中运用极大似然估计运行 的部分结果如表 7-16。
表 7-16常用拟合指数计算结果
拟合指 数 卡方值
(自由
CFI NFI IFI RMSEA AIC BCC EVCI (146)
从表 7-15和表 7-16可以看出,卡方值虽然增大了一些,但自由度大大增加了, 并且各拟合指数都得到了较大的改善(NFI 除外) 。该模型的各个参数在 0.01的 水平下都仍然是显著的,各方程的对应的测定系数相对而言增大了很多。
四、 最优模型参数估计的展示
表 7-17最优模型各路径系数估计
未标准化 路径系数 标准化 路径系
望 <---象 0.3530.03111.495***bb="">---象>
质量感 知 <--->--->
象 0.7230.02331.516***aa 0.814
质量感 知 <--->--->
望 0.1290.0353.687***par_160.134
顾客满 意 <--->--->
知 0.7230.02331.516***aa 0.627
顾客满 意 <--->--->
象 0.3530.03111.495***bb 0.345
顾客忠 诚 <--->--->
意 0.7230.02331.516***aa 0.753
a1<--->--->
象 10.925
a2<--->--->
象 1.0420.0252.853***b 0.901
a3<--->--->
象 0.7280.03620.367***d 0.631
a5<--->--->
望 10.836
a4<--->--->
望 0.7280.03620.367***d 0.622
a6<--->--->
望 0.8720.02633.619***a 0.808
a7<--->--->
望 1.0420.0252.853***b 0.853
a8<--->--->
望 0.8720.02633.619***a 0.731
a10<--->--->
知 10.779
a9<--->--->
知 1.1590.03632.545***c 0.914
a12<--->--->
知 1.0420.0252.853***b 0.777
a13<--->--->
知 0.8720.02633.619***a 0.677
a18<--->--->
意 10.861
a17<--->--->
意 1.0420.0252.853***b 0.919
a16<--->--->
意 1.0420.0252.853***b 0.963
a24<--->--->
诚 10.706
a23<--->--->
诚 1.1590.03632.545***c 0.847顾客忠
e7<-->e80.6990.0729.658***r20.46 e18<-->e170.2770.055.568***r10.289 e2<-->e30.2770.055.568***r10.178注 :“ ***”表示 0.01 水平上显著,括号中是相应的 C.R 值,即 t 值。 表 7-19最优模型方差估计
方差估计 S.E. C.R. P Label 超市形象 3.4610.27512.574***par_17 z22.4980.21911.42***par_18 z10.6450.0857.554***par_19 z40.4110.0626.668***par_20 z51.4470.1778.196***par_21 e51.2630.07816.217***v3 e42.4580.12519.59***v5 e61.1890.07316.279***v6 e71.1890.07316.279***v6 e81.9440.10917.84***v7 e101.7730.11914.904***v1
e90.7260.05214.056***v4 e121.9440.10917.84***v7 e132.4580.12519.59***v5 e181.2630.07816.217***v3 e170.7260.05214.056***v4 e243.3670.19817.048***v2 e223.3670.19817.048***v2 e231.7730.11914.904***v1 e10.5830.0747.876***par_22 e20.8710.08610.13***par_23 e32.7810.19714.106***par_24 e160.3140.0466.863***par_25注 :“ ***”表示 0.01 水平上显著,括号中是相应的 C.R 值,即 t 值。
第五节 模型解释
结构方程模型主要作用是揭示潜变量之间(潜变量与可测变量之间以及可 测变量之间) 的结构关系, 这些关系在模型中通过路径系数 (载荷系数) 来体现。 若要输出模型的直接效应、 间接效应以及总效应, 需要在 Analysis Properties中的 Output 项选择 Indirect , direct & total effects项(如图 7-31) 。
对于修正模型, Amos 输出的中各潜变量之间的直接效应、 间接效应以及总 效应如表 7-20。
1.直接效应 (direct effect)
指由原因变量(可以是外生变量或内生变量)到结果变量(内生变量)的 直接影响, 用原因变量到结果变量的路径系数来衡量直接效应。 比如利用表 7-17最后一列的结果,超市形象到质量期望的标准化路径系数是 0.814,则超市形象 到质量感知的直接效应是 0.814。 这说明当其他条件不变时, “超市形象” 潜变量 每提升 1个单位, “质量期望”潜变量将直接提升 0.698个单位。
2.间接效应 (indirect effect)
指原因变量通过影响一个或者多个中介变量, 对结果变量的间接影响。 当只有一 个中介变量时,间接效应的大小是两个路径系数的乘积。比如利用表 7-17最后 一列的结果,超市形象到质量期望的标准化路径系数是 0.384,质量期望到质量 感知的标准化路径系数是 0.134,则超市形象到质量感知的间接效应就是 0.384×0.134=0.051。 这说明当其他条件不变时, “超市形象” 潜变量每提升 1个单位, “质量感知”潜变量将间接提升 0.385个单位。
3.总效应 (total effect)
由原因变量到结果变量总的影响, 它是直接效应与间接效应之和。 比如利用 表 7-17最后一列的结果,超市形象到质量感知的直接效应是 0.814,超市形象到 质 量 感 知 的 间 接 效 应 是 0.051, 则 超 市 形 象 到 质 量 感 知 的 总 效 应 为 0.814+0.051=0.865。这说明当其他条件不变时, “超市形象”潜变量每提升 1个 单位, “质量感知”潜变量总共将提升 0.865个单位。
图 7-31 输出模型的直接效应、间接效应以及总效应
表 7-20模型中各潜在变量之间的直接效应、 间接效应以及总效应 (标 准化的结果)
(直接效应) (11.543)
(间接效应)
(总效应) 0.384
质量感知 (直接效应) 0.814***
(31.659)
0.134*** (3.735)
(间接效应) 0.051
(总效应) 0.8650.134
顾客满意 (直接效应) 0.345***
(11.543)
0.627*** (31.659)
(间接效应) 0.5430.084
(总效应) 0.888 0.084 0.627
顾客忠诚 (直接效应) 0.753*** (31.659)
(间接效应) 0.669 0.0630.473
(总效应) 0.669 0.063 0.473 0.753注 :“ ***”表示 0.01 水平上显著,括号中是相应的 C.R 值,即 t 值。表中给出 的均是标准化后的参数 , 直接效应就是模型中的路径系数。
范文四:结构方程模型案例
结构方程模型(Structural Equation Modeling,SEM)
20世纪——主流统计方法技术:因素分析 回归分析
20世纪70年代:结构方程模型时代正式来临 结构方程模型是一门基于统计分析技术的研究方法学,它 主要用于解决社会科学研究中的多变量问题,用来处理复杂的多变量研究数据的探究与分析。在社会科学及经济、市场、管理等研究领域,有时需处理多个原因、多个结果的关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不能很好解决的问题。SEM能够对抽象的概念进行估计与检定,而且能够同时进行潜在变量的估计与复杂自变量/因变量预测模型的参数估计。
结构方程模型是一种非常通用的、主要的线形统计建模技术,广泛应用于心理学、经济学、社会学、行为科学等领域的研究。实际上,它是计量经济学、计量社会学与计量心理学等领域的统计分析方法的综合。多元回归、因子分析和通径分析等方法都只是结构方程模型中的一种特例。
结构方程模型是利用联立方程组求解,它没有很严格的假定限制条件,同时允许自变量和因变量存在测量误差。在许多科学领域的研究中,有些变量并不能直接测量。实际上,这些变量基本上是人们为了理解和研究某类目的而建立的假设概念,对于它们并不存在直接测量的操作方法。人们可以找到一些可观察的变量作为这些潜在变量的“标识”,然而这些潜在变量的观察标识总是包含了大量的测量误差。在统计分析中,即使是对那些可以测量的变量,也总是不断受到测量误差问题的侵扰。自变量测量误差的发生会导致常规回归模型参数估计产生偏差。虽然传统的因子分析允许对潜在变量设立多元标识,也可处理测量误差,但是,它不能分析因子之间的关系。只有结构方程模型即能够使研究人员在分析中处理测量误差,又可分析潜在变量之间的结构关系。
简单而言,与传统的回归分析不同,结构方程分析能同时处理多个因变量,并可比较及评价不同的理论模型。与传统的探索性因子分析不同,在结构方程模型中,我们可以提出一个特定的因子结构,并检验它是否吻合数据。通过结构方程多组分析,我们可以了解不同组别内各变量的关系是否保持不变,各因子的均值是否有显著差异。”
目前,已经有多种软件可以处理SEM,包括:LISREL,AMOS, EQS, Mplus.
结构方程模型包括测量方程(LV和MV之间关系的方程,外部关系)和结构方程(LV之间关系的方程,内部关系),以ACSI模型为例,具体形式如下:
测量方程 y=Λyη+εy , x=Λxξ+εx=(1)
结构方程 η=Bη+Гξ+ζ 或 (I-Β)η=Гξ+ζ (2)
其中,η和ξ分别是内生LV和外生LV,y和x分别是和的MV,Λx和Λy是载荷矩阵,Β和Г是路径系数矩阵,ε和ζ是残差。
误差 观察变量 负荷量 潜在变量
三种分析方法对比
线性相关分析:线性相关分析指出两个随机变量之间的统计联系。两个变量地位平等,没有因变量和自变量之分。因此相关系数不能反映单指标与总体之间的因果关系。
线性回归分析:线性回归是比线性相关更复杂的方法,它在模型中定义了因变量和自变量。但它只能提供变量间的直接效应而不能显示可能存在的间接效应。而且会因为共线性的原因,导致出现单项指标与总体出现负相关等无法解释的数据分析结果。
结构方程模型分析:结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。
结构方程模型假设条件
⑴合理的样本量(James Stevens的Applied Multivariate Statistics for the Social Sciences一书中说平均一个自变量大约需要15个case;Bentler and Chou (1987)说平均一个估计参数需要5个case就差不多了,但前提是数据质量非常好;这两种说法基本上是等价的;而Loehlin (1992)在进行蒙特卡罗模拟之后发现对于包含2~4个因子的模型,至少需要100个case,当然200更好;小样本量容易导致模型计算时收敛的失败进而影响到参数估计;特别要注意的是当数据质量不好比如不服从正态分布或者受到污染时,更需要大的样本量)
⑵连续的正态内生变量(注意一种表面不连续的特例:underlying continuous;对于内生变量的分布,理想情况是联合多元正态分布即JMVN)
⑶模型识别(识别方程)(比较有多少可用的输入和有多少需估计的参数;模型不可识别会带来参数估计的失败)
⑷完整的数据或者对不完整数据的适当处理(对于缺失值的处理,一般的统计软件给出的删除方式选项是pairwise和listwise,然而这又是一对普遍矛盾:pairwise式的删除虽然估计到尽量减少数据的损失,但会导致协方差阵或者相关系数阵的阶数n参差不齐从而为模型拟合带来巨大困难,甚至导致无法得出参数估计;listwise不会有pairwise的问题,因为凡是遇到case中有缺失值那么该case直接被全部删除,但是又带来了数据信息量利用不足的问题——全杀了吧,难免有冤枉的;不杀吧,又难免影响整体局势)
⑸模型的说明和因果关系的理论基础(实际上就是假设检验的逻辑——你只能说你的模型不能拒绝,而不能下定论说你的模型可以被接受)
结构方程模型的技术特性:
1. SEM具有理论先验性
2. SEM同时处理测量与分析问题 3. SEM以协方差的运用为核心,亦可处理平均数估计
4. SEM适用于大样本的分析——一般而言,大于200以上的样本,才可称得上是一
个中型样本。
5. SEM包含了许多不同的统计技术。
6. SEM重视多重统计指标的运用
结构方程模型的实施步骤
⑴模型设定。研究者根据先前的理论以及已有的知识,通过推论和假设形成一个关于一组变量之间相互关系(常常是因果关系)的模型。这个模型也可以用路径表明制定变量之间的因果联系。
⑵模型识别。模型识别时设定SEM模型时的一个基本考虑。只有建设的模型具有识别性,才能得到系统各个自由参数的唯一估计值。其中的基本规则是,模型的自由参数不能够多于观察数据的方差和协方差总数。
⑶模型估计。SEM模型的基本假设是观察变量的反差、协方差矩阵是一套参数的函数。把固定参数之和自由参数的估计带入结构方程,推导方差协方差矩阵Σ,使每一个元素尽可能接近于样本中观察变量的方差协方差矩阵S中的相应元素。也就是,使Σ与S之间的差异最小化。在参数估计的数学运算方法中,最常用的是最大似然法(ML)和广义最小二乘法(GLS)。 ⑷模型评价。在已有的证据与理论范围内,考察提出的模型拟合样本数据的程度。模型的总体拟合程度的测量指标主要有χ2检验、拟合优度指数(GFI)、校正的拟合优度指数(AGFI)、均方根残差(RMR)等。关于模型每个参数估计值的评价可以用“t”值。
⑸模型修正。模型修正是为了改进初始模型的适合程度。当尝试性初始模型出现不能拟合观察数据的情况(该模型被数据拒绝)时,就需要将模型进行修正,再用同一组观察数据来进行检验。
探索性分析
定义:
探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。 因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。
探索性因子分析(EFA)致力于找出事物内在的本质结构。
残差 指标 因子负荷 潜变量
探索性分析的适用情况:
在缺乏坚实的理论基础支撑,有关观测变量内部结构,一般用探索性因子分析。先用探索性因子分析产生一个关于内部结构的理论,再在此基础上用验证性因子分析。但这必须用分开的数据集来做。
探索性分析步骤:
1、辨别、收集观测变量。按照实际情况收集观测变量,并对其进行观测,获得观测值。针对总体复杂性和统计基本原理的保证,通常采用抽样的方法收集数据来达到研究目的。
2、获得协方差阵(或Bravais-Pearson的相似系数矩阵)。我们所有的分析都是从原始数据的协方差阵(或相似系数矩阵)出发的,这样使我们分析得到的数据具有可比性,所以首先要根据资料数据获得变量协方差阵(或相似系数矩阵)。
3、确定因子个数。有时候你有具体的假设,它决定了因子的个数;但更多的时候没有这样的假设,你仅仅希望最后的到的模型能用尽可能少的因子解释尽可能多的方差。如果你有k个变量,你最多只能提取k个因子。通过检验数据来确定最优因子个数的方法有很多,例如Kaiser准则、Scree检验。方法的选择由,具体操作时视情况而定。
4、提取因子。因子的提取方法也有多种,主要有主成分方法、不加权最小平方法、极大似然法等,我们可以根据需要选择合适的因子提取方法。其中主成分方法一种比较常用的提取因子的方法,它是用变量的线性组合中,能产生最大样品方差的那些组合(称主成分)作为公共因子来进行分析的方法。 5、因子旋转。因子载荷阵的不唯一性,使得可以对因子进行旋转。这一特征,使得因子结构可以朝我们可以合理解释的方向趋近。我们用一个正交阵右乘已经得到的因子载荷阵(由线性代数可知,一次正交变化对应坐标系的一次旋转),使旋转后的因子载荷阵结构简化。旋转的方法也有多种,如正交旋转、斜交旋转等,最常用的是方差最大化正交旋转。
6、解释因子结构。最后得到的简化的因子结构是使每个变量仅在一个公共因子上有较大载荷,而在其余公共因子上的载荷则比较小,至多是中等大小。通过这样,我们就能知道所研究的这些变量是由哪些潜在因素(也就是公共因子)影响的,其中哪些因素是起主要作用的,而哪些因素的作用较小,甚至可以不用考虑。
7、因子得分。因子分析的数学模型是将变量表示为公共因子的线性组合,由于公共因子能反映原始变量的相关关系,用公共因子代表原始变量时,有时更利于描述研究对象的特征,因而往往需要反过来将公共因子表示为变量的线性组合,即因子得分。
验证性因子分析
定义:
验证性因子分析是对社会调查数据进行的一种统计分析。它测试一个因子与想对应的测度项之间的关系是否符合研究者所设计的理论关系。
验证性因子分析 (confirmatory factor analysis) 的强项在于它允许研究者明确描述一个理论模型中的细节。因为测量误差的存在,研究者需要使用多个测度项。当使用多个测度项之后,我们就有测度项的“质量”问题,即效度检验。而效度检验就是要看一个测度项是否与其所设计的因子有显著的载荷,并与其不相干的因子没有显著的载荷。
对测度模型的检验就是验证性测度模型。对测度模型的质量检验是假设检验之前的必要步骤。
而验证性因子分析(CFA)是用来检验已知的特定结构是否按照预期的方式产生作用。
验证性因子分析的步骤:
1、定义因子模型。包括选择因子个数和定义因子载荷。因子载荷可以事先定为0或者其它自由变化的常数。或者在一定的约束条件下变化的数(比如与另一载荷相等)。这是和探索性因子分析在分析方法上的一个重要差异,我们可以用一个直观的比喻,也就是说探索性因子分析是在一张白纸上作图,而验证性因子分析是在一张有框架的图上完善和修改。
2、收集观测值。定义了因子模型以后,我们就可以根据研究目的收集观测值了。这一点与探索性因子分析有一定的相似之处。
3、获得相关系数矩阵。与探索性因子分析一样,我们的分析都是在原始数据的相关系数矩阵基础上进行的,所以首先就要得到相关系数矩阵。实际上方差协差阵、相似系数矩阵和相关阵之间是可以相互转化的。 4、根据数据拟合模型。我们需要选择一个方法来估计自由变化的因子载荷。在多元正态的条件下,最常用的是极大似然估计,也可采用渐进分布自由估计。
5、评价模型是否恰当。这一步可以说是验证性因子分析的核心。当因子模型能够拟合数据时,因子载荷的选择要使模型暗含的相关阵与实际观测阵之间的差异最小。最好的参数被选择以后,差异量能被用来作为衡量模型与数据一致的程度。最常用的模型适应性检验是卡方拟合优度检验。原假设是模型是适应性模型,备择假设是存在显著差异。但是,这个检验受样本量大小影响,包含大样本的检验往往会导致拒绝原假设,尽管因子模型是合适的。其他的统计方法,比如用Tucker-Lewis指数,比较建议模型和“原模型”的拟合度。这些方法受样本量大小影响不大。
6、与其他模型比较。为了得到最优模型,我们需要完成这一步。如果你想比较两个模型,其中一个是另一个的缩略形式,你就能从卡方统计量的值检查出他们的差别,大约服从卡方分布。几乎所有独立因子载荷的检验能用来作为全因子模型和简因子的模型之间的比较。为以防你不是在检查全模型和简模型,你可以比较均方根误差的近似值 (RMSEA),它是模型中每个自由度差异的一个估计值。
验证性分析适用情况
验证性因子分析要处理推论统计量,处理难度要求高。需要具备更大容量的样本。精确的样本量要随着观测值和模型的因子数变化而变化,但一个标准模型至少需要200个个体。在进行分析过程中必须选择与每个因子在很大程度上匹配的变量,而不是可能是潜在变量的“随机样本”。
基于结构方程全模型的大学生就业预期情况分析
0 引言
随着我国经济的不断发展,我国高校大规模扩招,越来越多的年轻人获得了接受教育的机会。从社会发展的角度来讲,大批高素质的人才培养是与我国快速发展的社会经济水平相适应的。然而,由此也带来了两方面的问题:
一是本科生的就业矛盾日益突出,几乎每一个大学生都在切身感受就业的恐慌;
二是人才的竞争加剧,加之市场对于人才的需求多元化,考研或出国深造成为提高我们本科生自身核心竞争力的一种渠道,同时也是规避就业难的一种新途径;
那么,在如此就业形势严峻、人才竞争加剧的当今社会,大学生们对自己将来的就业有怎样的预期呢?
本论文基于辽宁工程技术大学数学与统计学院2005级统计系本科生于2007年10月至11月期间收集的题目为“大学生就业与深造意向调查”的原始问卷资料,欲从大学生的就业预期角度出发,结合结构方程模型,分析大学生预期就业手段和预期就业地域方面的相关情况,并期望推广结构方程模型应用于问卷分析的方法。
1 问题分析
1.1 研究目的
本论文在采用量表方式对问卷中的定性变量予以赋值后,欲分析影响大学生预期就业手段和预期就业地域的因素,并期望得到各个因素与大学生预期就业手段、预期就业地域之间的关系的度量。
需注意:
⑴该调查的调查对象是辽宁工程技术大学全日制在读本科生。调查对象仅仅是来自大学生这个总体的一个群或层。根据抽样调查的相关理论,辽宁工程技术大学在读本科生并不具有典型代表性,即它作为大学生总体的一个群被抽出并不具备随机性和强代表性。因此,本论文从这份调查数据出发,仅仅只是从一个相对小的视角研究大学生预期就业手段、预期就业地域方面的情况,结果不一定适用于大学生总体。
⑵问卷数据归属于2009年10月这个时点,因此,本论文的分析结果当然是对2009年10月这个时点相关情况的反映。
1.2 研究方法 本论文考虑建立结构方程全模型来研究大学生预期就业手段和预期就业地域(内生潜变量)与其各个因素(外生潜变量)之间的关系,并量化这种关系。结构方程模型的优势就在于引入潜变量(不可直接观测的量),使人们考虑问题的思路跃然纸上,显得更加系统化。也就是,它以如下的方式考虑问题:
那么,研究外生潜变量对内生潜变量的影响实质上就是间接研究X指标对Y指标的影响。只不过,结构方程把由同一个潜变量控制的指标划分为一类,表示这一类指标受该潜变量的影响,使得问题的分析更加的系统。
值得注意的是,本论文的研究基础——问卷资料来自于第二方的调查资料,第二方事先并未考虑过用结构方程模型分析问卷。那么,本文运用结构方程模型分析问卷,问卷中的问题就不一定能很好地切合结构方程模型,由此可能引起相当的误差。这也就决定了我们在确定运用结构方程模型分析问卷时,已有心理准备面对模型可能出现的整体拟合效果不好等问题,故本文着眼于推广结构方程模型建模方法在问卷分析中的应用。也就是说,欲用结构方程模型分析问卷,应该事先根据相关理论或经验初步设定几个潜变量,然后在问卷中为每一个潜变量设置若干的题目来测量它。
2 问卷数据的收集
2.1数据来源
本论文数据来自于辽宁工程技术大学理学院2007级统计系本科生于2009年10月至11月期间收集的题目为“大学生就业与深造意向调查”的原始问卷资料。该次调查的调查对象为辽宁工程技术大学全日制在读本科生(辽宁工程技术大学二级学院的学生不包括在内)。具体说来,本论文仅仅提取在问卷的“甄别问题”部分回答“就业”的那部分人(共计280人)的相关信息进行分析。
2.2抽样方法
该次调查按学科类别(文科、理科、工科、其他)和年级(大一、大二、大三、大四)
将研究总体分为16个层,由于“其他类”的大一和大四的数据难以取得,因此,仅针对其余
14个层进行抽样。根据抽样框,在每层中按简单随机抽样抽取20%的班级,同时在抽中的班级中按简单随机抽样抽取30%的学生。
2.3问卷内容及执行情况
调查问卷详见附录三。
该次调查专门成立调查组,按照被抽中学生的花名册由专人负责发放问卷,共计发放问卷788份,实际收回问卷758份,提取有效问卷706份。
3 问卷数据的处理
3.1 定性变量的分类及赋值方法
???二项分类变量:比如性别(男,女),???? 常赋值为0,1或1,2;?无序分类变量???多项分类变量:比如学科类别(工,文,理),
?? 常赋值为1,2,3,?,仅表示类别,无实际意义???定性变量? (所分类别或属性之间无程度或顺序的差别。)
???有序分类变量:比如满意度按非常不满意、不满意、一般、满意、非常满意分类,??,注意要等间距,表示程度的递进或顺序? 常赋值为1,2,3,
? 的递增(递减)。??? (所分类别之间有程度的差别。)
3.1 本文变量的设置
表1 指标的设置
表2 潜变量的设置
4.基于结构方程模型的大学生预期就业手段和就业区域情况分析
4.1 结构方程模型简介
很多社会、教育、心理等研究中涉及的变量,都不能准确、直接地测量,比如学习动机、家庭社会经济地位等,我们称这样的变量为潜变量。潜变量往往只能通过一些外生指标去衡量,比如用父母受教育程度、学生户口类型、父母收入等外生指标来衡量学生的社会经济地位(潜变量)。传统的统计分析方法不能妥善处理这些潜变量,而结构方程全模型则能同时处理潜变量及其指标。它是一种基于变量的协方差矩阵来分析多个变量之间关系的一种统计方法,也称为协方差结构分析。并且,它有机地整合了多元统计中的因子分析方法、生物学中的路径分析方法以及计量经济学中的联立方程模型。结构方程全模型由测量方程和结构方程组成。若结构方程模型中只包括测量方程,则又称为验证性因子模型。关于测量方程和结构方程的形式,最普遍的情况是设定为线性模型。
测量方程用来描述指标与潜变量之间的关系,用下述模型表示:
?Xm?AX??? ? ?4.1?
?Yn?AY???
T
这里,X?(x1,x2,.......,xm)T是由m个外生指标构成的列向量;??(?1,?2,.......,?u)是由u个外生潜变量构成的列向量;AX是一个m?u维的矩阵,称作X在?上的因子负荷阵,描述了外生指标与外生潜变量之间的关系;????1,?2,.......,?m?是m维的误差项列向量。
TY?(y1,y2,......,yn)T是由n个内生指标构成的列向量;??(?1,?2,.......,?v)是由v个内生变
T
量构成的列向量;AY是一个n?v维的矩阵,称作Y在?上的因子负荷阵,描述了内生指标与内生潜变量之间的关系;?=??1,?2,.......,?n?是n维的误差项列向量。
结构方程用来描述外生潜变量与内生潜变量之间的关系,用下述模型表示:
????????? ?4.2? 这里,?、?同上定义;?是一个v?v维的矩阵,描述内生潜变量之间的关系;?是一个v?u的矩阵,是?在?上的负荷,描述外生潜变量对内生潜变量的影响;
T
????1,?2,??,?v?为一个v维结构模型残差项列向量,反映了模型中未能解释?的部分。
4.2 模型的基本假定
⑴一般假定,每一个指标xi,yj?i?1,2,?,m;j?1,2,?,n?只在其对应的潜变量上有不为0的因子负荷,而在其他潜变量上的因子负荷为0。内生变量之间的路径(相关或单方面影响)依据经验和相关理论而定。
⑵测量误差项?i与外生潜变量?j之间(i,j?1,2,?,m)、测量误差项?i与内生潜变量?j之
?i与?j(i,j?1,2,?,m;i?j)?i与?j(i,j?1,2,?,n;i?j)?i与?j间不相关(i,j?1,2,?,n);、、(i,j?1,2,?,v;i?j)不相关。
4.3 结构方程模型路径图及形式
结合研究目的,首先我们根据相关研究及经验,找出影响大学生的预期就业手段和预期就业地域这两个内生潜变量的外生潜变量。然后,对问卷中的相关指标进行初步归类,建立验证性因子模型,并进行相关的参数估计、不断修正,最终确定潜变量的结构后,再加入结构方程模型。下图为拟采用的结构方程全模型的路径分析图,欲对各路径参数进行估计。
图1 拟采用的全模型路径分析图
图1的符号说明:
正方形或长方形表示指标;圆或椭圆表示潜变量;单向箭头表示单向影响;双箭头表示
相关;单向箭头指向指标表示测量误差;单向箭头指向潜变量表示内生潜变量未被解释的部分。
注意:
⑴确定需要用哪些指标衡量潜变量,可以根据经验分析进行初步归类,也可以使用多元统计分析中因子分析的方法进行探索。然后,对初步归类的指标建立验证性因子模型(即只有测量方程),并进行相应的参数估计,比较从属于同一潜变量的各路径参数的大小,进行相应的路径删减。
⑵结构方程全模型是否可识别不仅取决于数据质量,更取决于模型设定形式是否正确。模型形式的正确性就表现在潜变量指向指标的单向路径、外生潜变量之间的双向路径、内生潜变量之间的单向或双向路径、外生潜变量指向内生潜变量的单向路径划定是否正确。每一条路径对应一个待估参数(主要是模型中的系数(负荷)、误差方差、潜变量之间的相关系数)。一般的思路是先建立验证性因子模型,不断修正(删减路径或改变路径相连方式)、保证指标与潜变量之间的从属关系成立后,再建立结构方程,不断修正,渐渐修改为相对理想的模型。 ⑶在没有任何理论依据或经验的前提下,我们要考虑任意两个外生潜变量之间、任意两个内生潜变量之间的相关关系(路径为双向),然后根据模型的参数估计结果进行相应的路径增减。
⑷由图1,注意到本文拟采用的模型中,两个内生潜变量?1和?2均分别只用一个指标Y1和Y2衡量,相当于潜变量就是指标。原则上,结构方程模型并不允许这样的情况出现,因为单指标潜变量的存在会使得模型无法识别。倘若这种情况真的出现了,需在参数估计时固定负荷或方差等(详见附录四的程序)。本文模型的设定形式不得不包含单指标的潜变量,主要是由于我们基于第二方设计的问卷进行相关问题的分析,使得问卷内容设计和模型形式设定脱节,从而导致有些潜变量找不到一定数量的、合适的指标来测量。
对照图1,模型的形式设定为:
??11 0 0 ?
??? 0 0?21??? 0 0 ?31??
??x1???41 0 0??1?
??????
? 0 0x???5121??????2?
???2? +????1? ?????0 ?62 0??? ???????
????0 ?72 0???3?????x??0 ? 0?????11???11?82
?
?0 0 ?93???0 0 ?10,3???0 0 ? ?
11,3?? AX
?y1???11 0???1???1?
?2? ??????????
y0 ????2??22??2??2?
AY
实际上,由于内生潜变量?1,?2为单指标潜变量,?11,?22就是1,无需估计,
因而也就不存在误差项?1,?2 。
??1?
? ? ??0 ???111213?????1??1??12??1?
?3? ???????2?????????
??2???21 0???2???21 ?22 ?23?????2?
??3? ? ?
4.4 模型的识别
常用t?法则判断模型是否可识别:在结构方程模型?4.1???4.2?中,共有?m?n?个可观测变量,记t为模型中自由估计的参数个数,则模型可识别的一个必要条件是:
t?(m?n)(m?n?1)/2
该模型中共含有35个参数,包括11个负荷、3个潜变量之间的相关系数、11个观测变量的误差方差、结构模型的8个未知参数、2个内生潜变量的误差方差。由于 35?13?14/?2,故该模型可识别。91
4.5 模型的参数估计以及参数的显著性检验
1、模型的参数估计
利用结构方程模型软件AMOS7.0对模型的未知参数进行估计,源程序、输出结果分别见附录四和附录五。
结构方程模型参数估计的基本思想是:求参数使得模型隐含的协方差矩阵与样本协方差矩阵“差距”最小。对这个矩阵之间“差距”的不同定义方法,产生了不同的模型拟合方法及相应的参数估计。最常用的结构方程模型参数估计方法是极大似然函数法(ML),虽然此法需要假定观测指标的分布为正态或近似正态分布,但很多研究表明,即使指标的分布不为正态分布,ML方法也能得到合适的估计,尤其在大样本条件下。也即,ML估计是稳健的。 2、模型参数的显著性检验
AMOS7.0的输出结果给出了未标准化情况下,各因子负荷的估计以及与各负荷相应的标准差估计值和t?检验统计量值。一般可简单地取t值大于2为显著,即此时认为相应的负荷显著不为0。若有某几个因子负荷不显著,每次取消一个路径,重新运行程序后,再进行负
荷的显著性检验,重复此过程,直到各个负荷均显著为止。
AMOS7.0的输出结果也给出了标准化情况下参数的估计结果。标准化情况下,参数估计结果不受各指标或因子量纲的影响,便于对变量之间的相互关系进行分析。
本文的模型采用标准化情况下的参数估计结果,并且分两步确立:第一步建立验证性因子模型,确定潜变量的结构;第二步按照图1的模型(即加入结构方程),运行程序,删除不显著的路径后再次运行程序,共经历两次路径删除后,估计结果显示所有的因子负荷在置信水平??90%下,均已显著。从而得到本文估计模型的具体形式:
?0.404 0 0 ?
??0.712 0 0???0.768 0 0 ???
?x1??0.810 0 0??1????????x??0.653 0 0??1?2???2?????1? ?????0 0.519 0???2? +??? ?4.3???????????0 0.679 0????????3?
?x??0 0.634 0?????11??11?
?0 0 0.900????0 0 0.427???0 0 0.234 ??
y1??0.997 0???1???1?
?2? ? ??????????
?y2??0 0.886???2???2???1?
????0 0???1??0.123 0.162 0.145?????1??3? ?1????????????2???
?0.254 0?0.191 0 0??2???????2??2??
??3?
此外,输出结果(见附录五)中没有包含违背常理的参数估计值,比如说没有出现方差小于0、相关系数大于1等情况,说明用该模型拟合原始数据是合适的。
4.6 模型的整体拟合评价
根据结构方程模型中评价模型拟合优劣的相关理论,通常采用以下几种指标来评价模型的拟合效果:
⑴相对拟合指数(CFI):取值于0—1之间,越接近于1,模型整体拟合越好;
⑵近似均方根误差指数(RMSEA):其值越小越好。一般认为,RMSEA低于0.1表示好的拟合,低于0.05表示非常好的拟合。
⑶调整后的拟合优度指数(AGFI):取值于0—1之间,越接近1,模型整体拟合越好。 本文模型的拟合优劣指标汇总如下:
表3 模型的拟合指数
结合各个拟合指数的判断标准,由表1知,模型整体拟合效果一般。前述4.3节的注意(4)已分析过原因。
4.7 模型参数估计结果的解释
每一个观测指标对其从属的潜变量的标准化参数估计值(即负荷),有效地反映了该指标与相应潜变量之间的相关程度,同时也反映了潜变量对相应观测指标的解释能力。这可以由下图中各路径的参数清晰地表征出来:
图2 结果路径图
对比图1和图2,显然,在参数估计过程中,一些不显著的路径和方向被删除了。 由结果路径图,我们可以看出:
⑴大学生的社会经济地位?1、对就业情况的把握程度?2、自身能力?3对他们的预期就业手段均有影响,但影响差异不大。这与现实情况是相符的,通常家庭社会经济地位决定了大学生自主创业的原始资本(资金来源以及人际关系等),对就业情况的把握程度决定了大学生自主创业的动机和方向,而自身能力则决定了大学生自主创业的勇气和胆识。
⑵大学生的社会经济地位?1对他们的预期就业地域有影响,但大学生对就业情况的把握程度
?2、自身能力?3对他们的预期就业地域几乎没有影响。这也与现实情况相符,大学生的社会经济地位高低决定了他们对于就业地域的偏向(比如,现实中,比起家庭社会经济地位相对低的学生,往往是家庭社会经济地位相对高的学生更偏向于选择各方面条件都相对较好的地域工作譬如省会城市,也即家庭社会经济地位相对低的学生更能容忍相对差一些的工作地域)。另外,大学生对就业情况的把握程度以及自身能力对预期就业地域影响不显著,不管大学生对就业情况的把握程度如何,也不管大学生自身能力如何,现实中大学生预期就业地域的选择往往是家乡、发达城市或学校所在地。
⑶相比于预期就业地域对预期就业手段的影响,预期就业手段对预期就业地域的影响要更显著。这也是显然的,自主创业必然要考虑目标地域的供求情况,通常省会城市等需求相对大,供给才有市场。
⑷5个潜变量在13个观测指标上的标准化因子负荷不小于0.712的有6个。在标准化的情况下,指标与潜变量之间的复相关系数就是因子负荷的平方。因此,有6个复相关系数大于0.5,也就是说,相应的潜变量能解释指标的50%以上。但仅有6个复相关系数大于0.5,再次说明模型的解释能力一般,原因仍然是问卷内容设计和模型形式设定脱节,使得衡量潜变量的指标不恰当或过少。
4.8 模型存在的问题
⑴通常从拟合原始数据的能力和预测性能两方面评价一个模型。结构方程模型则更偏向于验证我们事先提出的关于潜变量的结构、潜变量之间的因果关系是否成立,并且量化变量之间的相互影响关系。若主要关注的是模型的预测性能,则结构方程并非首选。若采用SPSS或结构方程模型的软件,需要进行隔一段时间后的纵向调查,取得序列数据的支撑。大家可以选择系统动力学等软件。
⑵本文的模型拟合原始数据的能力一般,主要归咎于问卷内容设计与模型形式设定的脱节,使得无法找到一定数量的、恰当的指标来衡量潜变量。也就是说,本文建构的模型迁就于问卷,模型形式的设定可能有失偏颇。这也给问卷设计者提出了参考建议:要把问卷内容设计与欲采用的模型相结合,问卷内容要紧扣模型。
⑶本文的模型不得不引入单指标潜变量,为保证模型的可识别性,又不得不在进行参数估计时固定某些负荷以及某些误差的方差,虽然无法衡量这会使模型整体估计受到多大程度的影响,但造成误差是确定无疑的。一般说来,衡量潜变量的指标越多,潜变量的结构越稳定,
模型参数估计越容易收敛。为保证模型的可识别性,每个潜变量应至少用三个指标来衡量。
范文五:AMOS解释结构方程模型
AMOS 输出解读
惠顿研究
惠顿数据文件在各种结构方程模型中被当作经典案例,包括AMOS 和LISREL 。本文以惠顿的社会疏离感追踪研究为例详细解释AMOS 的输出结果。AMOS 同样能处理与时间有关的自相关回归。
惠顿研究涉及三个潜变量,每个潜变量由两个观测变量确定。67疏离感由67无力感(在1967年无力感量表上的得分)和67无价值感(在1967年无价值感量表上的得分)确定。71疏离感的处理方式相同,使用1971年对应的两个量表的得分。第三个潜变量,SES (社会经济地位)是由教育(上学年数)和SEI (邓肯的社会经济指数) 确定。
解读步骤
1. 导入数据。
AMOS 在文件ex06-a.amw 中提供惠顿数据文件。使用File/Open,选择这个文件。在图形模式中,文件显示如下。虽然这里是预定义模式,图形模式允许你给变量添加椭圆
,方形,箭头等元素建立新模型
2. 模型识别。
潜变量的方差和与它关联的回归系数取决于变量的测量单位,但刚开始谁知道呢。比如说要估计误差的回归系数同时也估计误差的方差,就好像说“我买了10块钱的黄瓜,然后你就推测有几根黄瓜,每根黄瓜多少钱”,这是不可能实现的,因为没有足够的信息。如何告诉你“我买了10块钱的黄瓜,有5根”,你便可以推出每根黄瓜2块钱。对潜变量,必须给它们指定一个数值,要么是与潜变量有关的回归系数,要么是它的方差。对误差项的处理也是一样。一旦做完这些处理,其它系数在模型中就可以被估计。 在这里我们把与误差项关联的路径设为1,再从潜变量指向观测变量的路径中选一条把它设为1。这样就给每个潜变量设置了测量尺度,如果没有这个测量尺度,模型是不确定的。有了这些约束,模型就可以识别了。
注释:设置的数值可以是1,也可以是其它数,这些数对回归系数没有影响,但对误差有影响,在标准化的情况下,误差项的路径系数平方等于它的测量方差。
3. 解释模型。
模型设置完毕后,在图形模
式中点击工具栏中计算估计按钮
。输出如下。蓝色字体用于注解,不
是AMOS 输出的一部分。
Title
Example 6, Model A: Exploratory analysis Stability of alienation, mediated by ses. Correlations, standard deviations and means from Wheaton et al. (1977).
以上是标题,全是英文,自己翻译去吧。
Notes for Group (Group number 1)
The model is recursive.
Sample size = 932
各组注释:它告诉你模型为递归模型,样本量为932。
Variable Summary (Group number 1)
Your model contains the following variables (Group number 1)
Observed, endogenous variables
anomia67
powles67
anomia71
powles71
educatio
SEI
Unobserved, endogenous variables
71_alienation
67_alienation
Unobserved, exogenous variables
eps1
eps2
eps3
eps4
ses
delta1
zeta1
zeta2
delta2
变量汇总:对模型中的变量作一些概括,内生观测变量:67无力感,67无价值感,71无力感,71无价值感,教育和SEI 。内生潜变量:67疏离感,71疏离感。外生潜变量:各种误差和社会经济地位。
注释:观测变量与潜变量的区别:一个用方形表示,一个用椭圆表示。内生和外生的区别:箭头指向自己的就是内生,发送箭头的就是外生。注意区分测量模型和结构模型。
Variable counts (Group number 1)
Number of variables in your model: 17
Number of observed variables: 6
Number of unobserved variables: 11
Number of exogenous variables: 9
Number of endogenous variables: 8
变量计数:数数模型中的变量,变量总数为17,其中观测变量有6个,潜变量有11个;外生变量有9个,内生变量有8个。
Parameter summary (Group number 1) Weights Covariances Variances Means Intercepts Total Fixed 11 0 0 0 0 11 Labeled 0 0 0 0 0 0 Unlabeled 6 0 9 0 0 15 Total 17 0 9 0 0
26 模型的参数概括:固定系数11个,就是模型识别中固定的11个1。还有6个自由的系数,9个方差对应着前面外生潜变量。
Computation of degrees of freedom (Default model)
Number of distinct sample moments: 21
Number of distinct parameters to be estimated: 15
Degrees of freedom (21 - 15): 6
(内定模型)的自由度计算:21 "样本矩" 是6个观测变量的6个样本方差加上15个协方差构成(也就是6中取2的组合数)。15个参数是模型的6个回归系数和9个被估计的方差。样本矩与估计参数的差为6个自由度。
(内定模型)迭代过程:极大似然估计是一个迭代过程。这里给出迭代历史。这个输出是可选的,你不必直接使用它。
Result (Default model)
Minimum was achieved
Chi-square = 71.544
Degrees of freedom = 6
Probability level = .000
卡方拟合指数:这是所有软件都使用的最普通的拟合检验。AMOS 和 LISREL 把它称为卡方统计量,其它软件称为卡方拟合优度 和 卡方拟合劣度 。卡方拟合指数检验选定的模型协方差矩阵与观察数据协方差矩阵相匹配的假设。原假设是模型协方差阵等于样本协方差阵。如果模型拟合的好,卡方值应该不显著。在这种情况下,数据拟合不好的模型被拒绝。卡方检验的问题是样本越大,越可能拒绝模型,越可能犯第一类错误。卡方拟合指数对违反多变量正态假设也是非常敏感。
这由卡方拟合指数的计算公式可以看出:
卡方统计量 = (N-1) x F
N 是样本量,F 是模型协方差阵和样本协方差阵的最小适配函数。这个函数比较复杂,也不知道是哪个天才1搞出来的,它的计算公式中包含行列式,矩阵的迹,还要取对数,再经过一些加减运算把多维数据压缩为一个数值。
从卡方统计量的计算中可以看出,如果适配函数减少的速度没有样本量增加的速度快2,即使模型协方差阵与样本协方差阵拟合的很好,但样本量的增加也会导致拒绝原假设。这种拒绝正确建议的行为就是犯了第一类错误。
如果不服从正态分布,卡方统计量会更多地拒绝真实模型。不过好在ML 估计比较稳健,所以即使违背了正态分布的假定,模型也能对付着用。
Maximum Likelihood Estimates
SEM 使用最大似然法3估计模型,而不是通常的最小二乘法。OLS 寻找数据点到回归线距离的最小平方和。MLE 寻找最大的对数似然,它反映 谢益辉注:这个函数叫差异函数,是一个叫Browne (1984)的“天才”搞出来的。
谢益辉注:此言慢讲,没有依据。
3 谢益辉注:除了ML ,还有GLS 、ULS 、WLS 、ADF 等方法,其中*LS系列的都是最小二乘法。 21
从自变量观测值预测因变量观测值的可能性有多大4。
Regression Weights: (Group number 1 - Default model) Estimate
67_alienation <--- ses="">--->
71_alienation <--->--->
71_alienation <--- ses="">--->
powles71 <--->--->
anomia71 <--->--->
powles67 <--->--->
anomia67 <--->--->
educatio <--- ses="">--->
SEI <--- ses="" 5.331="" s.e.="" c.r.="" p="" .056="" -10.912="" ***="" .053="" 13.200="" ***="" .054="" -3.213="" .001="" .042="" 20.427="" ***="" .043="" 20.577="" ***="" .431="" 12.370="" ***="" label="" par_6="" par_4="" par_5="" par_1="" par_2="">--->
回归系数是模型中带箭头的路径系数。为了识别模型,部分系数在模型识别中已固定为1 (例如,潜变量67疏离感到观测变量67无力感的路径) 。也给出路径系数的标准误。"C.R." 是临界比,它是回归系数的估计值除以它的标准误(- 0.614 / 0.056 = - 10.912 )。临界比与原假设有关,在这个案例中对67疏离感和社会经济地位的原假设是回归系数为 0。如果我们处理近似标准正态分布的随机变量,在 0.05 的显著性水平上,临界比估计的绝对值大于 1.96 称之为显著。这样67疏离感和社会经济地位的回归系数 -10.912 的绝对值大于 1.96,可以说这个回归系数在 0.05 显著性水平上显著地不等于 0 。P 值给出检验原假设总体中参数是 0 的近似双尾概值。它表示67疏离感和社会经济地位的回归系数显著地不等于 0,p=0.001。P 值的计算假定参数估计是正态分布,它只是对大样本正确。
Variances: (Group number 1 - Default model)
Estimate S.E.
ses 6.656 .641
zeta1 5.301 .483
zeta2 3.737 .388
eps1 4.010 .358
eps2 3.187 .284
4C.R. 10.379 10.967 9.623 11.186 11.242 P *** *** *** *** *** Label par_7 par_8 par_9 par_10 par_11 谢益辉注:这不是最大似然的本意,MLE 的意思是,对未知参数取值,使得样本“发生”的概率最大。因为,我们认为我们采集到的样本应该是以最大概率“发生”的,不然,它们怎么会被我们收集到呢。
Estimate S.E. C.R. P
Label
eps3 3.696 .391 9.443 *** par_12
eps4 3.622 .304 11.915 *** par_13
delta1 2.944 .501 5.882 *** par_14
delta2 260.630 18.256 14.277 *** par_15
方差的估计,标准误和临界比和P 值的解释同上。
用表格看数据总是让人眼花缭乱,还是看图示舒服些,这是上面表格数字的图形显示。
Modification Indices (Group number 1 - Default model)
Covariances: (Group number 1 - Default model)
M.I. Par Change
eps2 <--> -.424
eps2 <--> eps4 26.545 .825
eps2 <--> eps3 32.071 -.988
M.I. Par Change
eps1 <--> .421
eps1 <--> eps4 35.367 -1.069
eps1 <--> eps3 40.911 1.253
Variances: (Group number 1 - Default model)
M.I. Par Change
Regression Weights: (Group number 1 - Default model) M.I. Par Change
powles71 <--->--->
powles71 <--->--->
anomia71 <--->--->
anomia71 <--- 10.352="">--->
powles67 <--->--->
powles67 <--->--->
anomia67 <--->--->
anomia67 <--->--->
修正指数(MI)。拟合的改进是用卡方统计量的减少来测量, 它能发现使卡方拟合指数减少的有意义的信息。对每个固定和约束参数(系数),如果固定参数或等价约束通过去掉它的路径从模型中排除,模型被重新估计,修正指数预测卡方统计量的减少。"Par Change",表示参数的改变,它提供系数会改变多少的实际估计。
对协方差的修正指数,如果两个误差项变量允许相关,MI 与卡方统计量减少有关。对估计回归系数的修正指数,如果去掉两个变量间的路径,在模型中不再要求估计去掉路径的系数,MI 与卡方统计量的减少有关。常用的方法是去掉最大MI 的参数,通过卡方拟合指数看看测量效果。自然地,去掉路径或允许误差项变量相关只有当它有实际意义并且统计感觉也是这样时才能执行。LISREL 和AMOS 都计算修正指数。
既然这样, 最大的 MI 是 40.911 ,位于eps1 (67无力感误差项) 和eps3 (71无力感误差项) 间。建议去掉两个误差项相关系数为 0 的约束,即,允许相关将使卡方统计量的估计至少减少40.911。惠顿数据是纵向数据,在时间序列中,两个不同时间点(1967和1971)相同测量(无力感)的
自相关很相似,所以去掉这个约束在理论上有一个合理的理由。相同的逻辑用于去掉 eps2 和 eps4 (分别为1967和1971无价值感的误差变量) 间零相关的约束, 它使卡方统计量的估计减少26.545。
然而,在这个输出中,我们没有用这种方式重新设置模型。要看见改变设置的效果,见AMOS 自带文件 ex06-b.amw 。
Model Fit Summary
CMIN Model NPAR CMIN DF P CMIN/DF
Default model 15 71.544 6 .000 11.924
Saturated model 21 .000 0
Independence model 6 2131.790 15 .000 142.119
模型拟合汇总:AMOS 输出大量可替换的拟合模式测量。每个测量用三种模式计算。" 内定模式" 是由你自己设定的模式。" 独立模式" 是指模型中所有变量完全的独立,所以如果“内地模式”拟合的比“独立模式”差,那么应该拒绝内地模式。" 饱和模式" 是没有约束,总是完美拟合数据的模式,所以通常内地模式的拟合度量在独立模式和饱和模式之间。
NPAR 是模型中被估计的参数个数,不是拟合测量。
P(CMIN) 处理最小样本差异 。如果 P(CMIN) 小于 0.05,我们拒绝数据完全拟合模型的原假设。对大样本,原假设非常可能被拒绝。按照这个标准,这个模型作为完整拟合被拒绝。
CMIN/DF 是最小样本差异除以自由度。被称之为相对卡方或规范卡方。有些人允许这个值达到5作为适当的拟合,但是当相对卡方大于2或3时,保守的使用就需要拒绝模型。按照此标准,这个模型应被拒绝。 RMR, GFI
Model RMR GFI AGFI PGFI
Default model .284 .975 .913 .279
Saturated model .000 1.000
Independence model 12.342 .494 .292 .353
RMR 是残差均方根。RMR 是样本方差和协方差减去对应估计的方差和协方差的平方和,再取平均值的平方根,估计假定内地模型是正确的。RMR 越小,拟合越好。
GFI 是拟合优度指数,范围在0和1间,但理论上能产生没有意义的负数。按照约定,要接受模型,GFI 应该等于或大于0.90。按照此标准,这个模型可接受。
AGFI 是调整拟合优度指数,利用自由度和变量个数的比例来调整GFI ,它的变化范围也是0和1间,但理论上能产生没有意义的负数。AGFI 也应该至少大于0 .90。按照此标准,这个模型可接受。
PGFI 是简效拟合优度指数。它是独立模式的自由度与内定模式的自由度的比率乘以GFI 。
Baseline Comparisons IFI TLI NFI RFI CFI Delta1 rho1 Delta2 rho2
Default model .966 .916 .969 .923 .969
Saturated model 1.000 1.000 1.000
Independence model .000 .000 .000 .000 .000 Model
这是比较内定模式与独立模式拟合的一组拟合优度测量。因为独立模式通常很糟糕,内定模式与它做比较将使内定模式看起来良好但不能用于研究目的。标题 DELTA 和 RHO 是这些测量的可选名称。
NFI 是规范拟合指数,变化范围在0和1间, 1 = 完全拟合。按照约定,NFI 小于0.90 表示需要重新设置模型。
RFI 是相对拟合指数,它不保证其值的变化范围在0和1间。RFI 接近1表示拟合良好。
IFI 是增值拟合指数,它不保证其值的变化范围在0和1间。IFI 接近1表示拟合良好,大于0.90为可接受拟合。
TLI 是Tucker-Lewis 系数,也叫做Bentler-Bonett 非规范拟合指数
(NNFI)。TLI 不保证其值的变化范围在0和1间。TLI 接近1表示拟合良好。
CFI 是比较拟合指数,其值位于0和1之间。CFI 接近1表示拟合非常好,其值大于0.90表示模型可接受。
Parsimony-Adjusted Measures Model PRATIO PNFI PCFI
Default model .400 .387 .388
Saturated model .000 .000 .000
Independence model 1.000 .000 .000
PRATIO 是简效比率,它是内定模式的自由度与独立模式自由度的比率。 PRATIO 自身不是拟合优度检验,但在拟合优度中用于测量惩罚简效模型的PNFI 和PCFI (用相对较少的参数模型去估计与模型有关的变量数和关系。)
PNFI 是简效规范拟合指数,等于PRATIO 乘以 NFI 。
PCFI 是简效比较拟合指数,等于PRATIO 乘以 CFI 。
NCP Model NCP LO 90 HI 90
Default model 65.544 41.936 96.603
Saturated model .000 .000 .000
Independence model 2116.790 1968.786 2272.133
FMIN Model FMIN F0 LO 90 HI 90
Default model .077 .070 .045 .104
Saturated model .000 .000 .000 .000
Independence model 2.290 2.274 2.115 2.441
RMSEA
Model RMSEA LO 90 HI 90 PCLOSE
Default model .108 .087 .132 .000
Independence model .389 .375 .403 .000
NCP 是非中心参数。它和 F0 在计算 RMSEA (近似误差均方根)中
使用,它合并差异函数准则 (比较观测协方差矩阵与预测协方差矩阵) 和简效准则(见上面) 。对每一项,LO 90 和 HI 90 表示系数上 90% 置信限制。按照惯例,如果 RMSEA 小于或等于0.05,模型拟合的好。如果 RMSEA 小于0.08,有适当的模型拟合。按照此标准,这个模型应该被拒绝因为 RMSEA 是0.108。PCLOSE 检验 RMSEA 不大于0.05的原假设。因为PCLOSE 近似为0,我们拒绝原假设,得出结论 RMSEA 大于0.05,表示没有紧密的拟合。
AIC Model AIC BCC BIC CAIC
Default model 101.544 101.771 174.104 189.104
Saturated model 42.000 42.318 143.584 164.584
Independence model 2143.790 2143.881 2172.814 2178.814
ECVI Model ECVI LO 90 HI 90 MECVI
Default model .109 .084 .142 .109
Saturated model .045 .045 .045 .045
Independence model 2.303 2.144 2.470 2.303
这是一组基于信息理论的测量。当使用极大似然方法估计比较模型时,适合用这组准则。
AIC 是赤池信息准则。
BCC 是Browne-Cudeck 准则。
BIC 是贝耶斯信息准则,也是知名的赤池贝耶斯信息准则(ABIC)。 CAIC 是一致 AIC 准则。
ECVI 是AIC 的另一种变体。
MECVI 是BCC 的变体。
HOELTER
HOELTER HOELTER
.05 .01
Default model 164 219
Independence model 11 14 Model
这是 Hoelter 的临界数 N ,是在0.05或0.01水平上接受模型的最大样本量。它使你知道所使用的样本量是否足够用来估计模型的参数和模型的拟合。既然这样,这个模型的实际样本量是 932 ,并且模型被拒绝。如果样本量只有164,在0.05水平上接受模型。
Execution time summary
Minimization: .090
Miscellaneous: 1.312
Bootstrap: .000
Total: 1.402
估计模型的计算时间。计算这个模型总共用了1.402秒。
转载请注明出处范文大全网 » amos结构方程模型分析
-->-->-->-->-->-->-->-->-->-->