内容摘要:结构方程由于能够妥善处理日常统计方法难以处理的潜变量而引起关注,为促进学界对结构方程模型的了解与应用,本文在简要介绍结构方程模型基本理论的基础上,针对结构方程的应用问题,分析了其应用条件和分析步骤,并对常用的分析软件进行比较。
关键词:验证性因子分析 结构方程模型 LISREL软件 AMOS软件
验证性因子分析与结构方程模型
因子分析是医学、教育学、心理学、管理学、经济学等多个领域研究中常用的统计分析方法。因子分析主要有两种基本形式:探索性因子分析和验证性因子分析。探索性因子分析致力于找出事物内在的本质结构;而验证性因子分析是用来检验已知的特定结构是否按照预期的方式产生作用。传统的因子分析多以探索性研究为主,但20世纪60年代Jreskog 的验证性因子分析的通用算法发表,使得验证性因子分析逐渐兴起。其中,结构方程模型的发展和应用尤为突出。该模型由Jreskog与其合作者在20世纪70年代提出并逐步改进和完善,到90年代初期开始得到广泛应用。
在理论研究过程中通常需要处理一些难以直接度量的变量,如智力、能力、自尊、偏见等,这些涉及社会、心理研究的变量,由于很难准确、直接的测量,通常被称为潜变量。由于难以度量,常常利用一些外显指标对其进行间接测量。传统的统计分析方法不能妥善处理这些潜变量,而结构方程模型则在这方面表现出独特的优势。作为一种全面性的统计建模技术,它包含了回归分析、因子分析、路径分析和多元方差分析等一系列多元统计分析方法,既可以分析可观测变量之间的关系,又可以分析潜变量的作用。同时,它还可以处理多个因变量,并还将测量误差纳入分析之中。结构方程模型的基本构成是测量方程和结构方程,测量方程描述潜变量与指标之间的关系,结构方程则描述潜变量之间的关系。
(一)测量方程数学表达式
x=Λxξ+δ
y=Λyη+ε
需要说明的是,在结构方程模型中潜变量又区分为外源潜变量(即ξ变量)和内源潜变量(即η变量)。x为外源指标组成的向量,也就是回归分析中的自变量。y为内源指标组成的向量,也就是回归分析中的因变量。Λx,Λy分别代表x(外源指标)对ξ(外源潜变量),y(内源指标)对η(内源潜变量)的系数矩阵,也可以理解为因子分析中的因子载荷。δ和ε分别表示x和y的测量误差。
(二)结构方程数学表达式
η=Bη+Γξ+ζ
其中,B代表内生潜变量之间的相互影响,Γ代表外生潜变量对内生潜变量的影响,ζ为方程结构的误差项。内生潜变量和外生潜变量之间通过B和Γ系数矩阵以及误差向量ζ联系起来。
结构方程模型应用条件
理论基础。结构方程模型最重要的一个特性是它所进行的是验证性因子分析,因此,必须事先在理论分析的基础上提出理论模型,包括指标的选取、变量关系的假设、参数的设定、模型的安排,每一个步骤都必须有清楚的理论概念和严密的逻辑推理。结构方程模型是对理论分析基础上提出的概念模型的检验,而不是探索新的模型。
样本分布。最大似然估计法是结构方程分析最常用的估计方法,不过ML使用时,有一个条件即变量是多元正态分布的,因此,使用结构方程模型进行验证性因子分析时,需要分析样本指标分布特征。如果指标是非正态分布的,可以事先对指标进行变换,将其正态化。同时,还要注意是否存在异常数据,如果发现极端或离群数据,可以考虑将其删掉。
样本量。在结构方程模型分析中,究竟样本量达到多少方为适度,这个问题尚无一致结论。与其他的统计技术一样,结构方程模型分析所使用的样本规模越大越好,就样本量下限而言,一般认为,当样本低于100时,几乎所有的结构方程模型分析都是不稳定的,大于200以上的样本,才称得上一个中型样本。若要得到稳定的结构方程模型结构,低于200的样本数量是不鼓励的。有些学者将最低样本量与模型变量结合在一起,建议样本数至少应为变量的十倍,这一规则经常被引用。
结构方程模型分析步骤
结构方程模型的分析主要包括两个内容,即提出理论模型和利用软件进行模型验证分析。具体可通过以下步骤完成:
第一步,提出理论模型。即研究者根据所研究问题,结合相关理论,提出假设模型。假设模型包括:指标与潜变量的关系、各潜变量之间的关系。模型复杂时,根据需要限制因子负荷或因子相关系数等参数的数值或关系。
第二步,执行结构方程分析。在提出理论模型后,研究者就可以利用搜集的资料,运用结构方程模型的分析软件,得到模型参数估计。
第三步,模型评价。根据结构方程模型的估计结果,分析各参数估计值是否在合理范围,同时,分析多个不同类型的拟合优度指数,衡量模型的拟合程度。
第四步,模型修正。在进行结构方程模型的估计和评价过程中,分析软件通常会提供模型修正的信息,研究者可以根据这些信息,检验在理论推导过程中的疏忽和盲点,调整初始模型并重新进行参数估计和模型评价,推导出更有意义的假设模型。
需要说明的是,模型修正并不是所有的结构方程模型分析都会进行,而且从某种意义上说,这种做法也违背了结构方程模型的理论验证性精神,但是考虑到研究者的理性总是有限的,在分析问题时未必都能足够的全面和深刻,重视原始资料中所潜藏的信息和逻辑关系,以改进个体思维,也是必要的。
结构方程模型分析软件
随着结构方程模型的发展和广泛应用,各类专门性分析软件也不断被开发出来。目前能够专门进行结构方程模型分析的软件主要有LISREL、EQS、AMOS、MPLUS、CALIS、RAMONA等,这些分析工具大多配有视窗软件和文字操作系统,使得结构方程模型的分析功能大大提升,适用范围迅速扩展。其中,LISREL和AMOS在我国运用较为广泛,这里仅对二者进行简单分析。
(一)LISREL软件
LISREL 是针对结构方程模型的最早的分析软件,由Jreskog与其合作研究者Srbom在20世纪70年代提出。该分析工具的推出,曾被称为统计的革命(Cliff,1983)。LISREL方法通过拟合模型估计协方差与样本协方差来估计模型参数,也称为协方差建模方法。具体来说,就是使用极大似然、非加权最小二乘、广义最小二乘或其他方法,构造一个模型估计协方差与样本协方差的拟合函数,然后通过迭代方法,得到使拟合函数值最优的参数估计。经过多年的修正,软件的最新版本LISREL8.8已于
LISREL在建立一个模型时,可以通过两种方式,以路径图的形式或者通过程序语言。利用程序语言进行模型设定时,包括设定测量方程和结构方程。将一个完整的结构方程模型的测量和结构方程描述出来需要八个不同的矩阵,每一个矩阵当中的参数可以被设定为固定、自由估计或加以特殊的限定。LISREL分析就是利用这些矩阵,来整理不同的参数并进行估计。
就一般的LISREL模型而言,建立命令文件步骤如下:
第一步,规定数据特征,包括:变量个数,变量名,数据形式(如行数据、方差和协方差的汇总统计量)。第二步,读取数据。第三步,规定一般模型特征:多少个潜在的和显在的外生变量和内生变量;模型中的矩阵类型(如若是方阵,是对称的还是对角阵);模型中自由的或固定的参数矩阵。第四步,规定个别矩阵元素为自由参数、固定参数和约束参数。第五步,规定非零固定参数值,规定迭代初始值。第六步,规定输出要求,设置缺省的或重新规定估计性能及输出特征。
(二)AMOS软件
AMOS是Analysis of Moment Structures的缩写,即矩结构分析,由James Arbuck -le设计开发,当前AMOS的最新版本为AMOS7.0。AMOS与LISREL软件一样,可以用来绘制路径图形,分析协方差结构。不同的是,AMOS具有强大的图形界面,使得软件操作非常简单,只需通过点击和拖放操作就可以完成所有任务,无需输入任何指令。除此之外,AMOS的完全信息最大似然估计技术使得分析缺失数据变为可能,它可以读取多种格式的原始和统计汇总数据以及实现在无严格假设时的模型估计。
AMOS的突出特点表现在:
第一,图形化用户界面。通过一个路径图浏览器显示文件夹中所有路径图的描述和缩略图,只需用鼠标点击就可选择编程选项。
第二,建模能力。AMOS会尝试许多模型,使用Aikaike信息标准(AIC)和Bayesian信息标准(BIC)统计方法比较模型,并找出最适用的模型。
第三,建模。可以使用路径图来定制模型,使用绘图工具改变路径图,从而更改模型。还可以在路径图上图形化地显示参数估计和拟合测量,以及在路径图上绘图的任何时刻显示自由度。
第四,分析能力和统计功能。使用完全信息最大似然估计得到更有效、更小偏倚的缺失值估计。使用快速自举模拟,对于任意实验分布下的任何模型参数估计,找到近似分布。
第五,输出。使用增强的文本输出显示选项和表格格式选项。可以将数值链接至“use-it-in-a-sentence”帮助,得到有关数字含义的简单明了的英语说明。
结构方程模型应用中应注意的问题
结构方程模型集合了多种传统分析方法的优点,同时拥有自身优点,在心理学、社会学、教育学及管理学等领域得到广泛应用。但结构方程模型在具体应用中,应注意以下问题:
从学术应用价值讲,结构方程模型是一种因果关系的验证性技术而非探索性技术,切忌仅计算潜变量之间的相关关系或用作全新量表的开发,也不应轻易根据修正指数调整模型。
当数据和模型拟合时,只表示数据不否定研究者所建立的理论模型,不表明证明了模型。
由于相同的变量,根据不同的理论会产生许多模型,往往变量越多,变量组合而成的模型也越多,这样就给模型的合适性检验带来了难度,而许多人常常忽视某一种关系的多个解释,这就容易造成结构偏差。因此,研究者在具体应用时应着重比较不同模型,并注意等价模型。
结构方程模型统计方法本身还有待完善,特别是拟合指数易受样本大小制约,对拟合指数的选择还有待进一步解决。目前,应用者可以参阅多个不同类型而表现稳定的拟合指数,如TLI、RNI、RMSEA和χ2。
从某一样本数据经探索性分析而获得的模型,必须经另一样本的验证分析,才能确立此模型的适用性。
注意潜变量与观测变量之间的逻辑关系,必要时转换数据分析工具,不应因为采用结构方程模型而错误解释为因果关系。
参考文献:
1.王松涛.探索性因子分析与验证性因子分析比较研究[J].兰州学刊,2006(5)
2.贾新明,刘亮.结构方程模型与联立方程模型的比较[J].数理统计与管理,2008(3)
3.霍映宝. LISREL与PLS路径建模原理分析与比较[J].统计与决策,2006(10)
作者简介:
朱远程(1957- ),女,汉族,重庆人,北京工业大学经济与管理学院副教授。研究方向:统计学方法应用。
马栋(1985- ),男,汉族,山东人,北京工业大学经济与管理学院硕士研究生。研究方向:应用统计。