简论Bootstrap探索性因素分析方法及其应用.doc
文本预览下载声明
简论Bootstrap探索性因素分析方法及其应用
关键词:Bootstrap探索性因素分析;有放回抽样;Procrustes因子旋转
1 引言
应用探索性因素分析(Exploratory Factor Analysis)从为数众多的可观测的心理研究变量中,建立数学模型,从中综合出较少的几个“共同因素”,并以这些“共同因素”解释最大量的观测事实。探索性因素分析用简洁及最基本的概念,揭示事物之间的本质联系,在国内心理学研究中,特别是在量表编制过程、试题结构效度分析中得到广泛的应用。科学的本质在于可重复、可推广性,可重复性是科学的必要条件、基本原则。作为心理学研究者,想要知道研究结果是否可重复、在某一样本得到的研究结果能否推广到同一总体的其他样本中。传统的探索性因素分析方法没有提供研究结果可重复的概率,无法告知这一点。而Bootstrap探索性因素分析则可提供研究结果的可靠性方面的信息,如研究者可获知所编制的量表的可靠性如何。
要获得研究结果的可重复性,一般有两种方法:外部重复性方法和内部重复性方法。外部重复性方法通过重新收集一个新的同质样本来评价研究结果的可重复性,虽然外部重复性方法可获得研究结果可重复性的最好证据,但耗时耗力,心理学研究有时甚至无法得到新的同质样本。而内部重复性方法不需要收集另一个同质样本,充分利用原样本的信息,包括交叉验证法、Jackknife方法(即刀切法)、Bootstrap方法(即自助法)。其中,Bootstrap方法是Efron于1979年提出的一种统计推断方法,不需要对总体分布作假设或者事先推导统计量的解析式,并且Efron和Gong证明Bootstrap方法优于其他内部重复性方法。Bootstrap方法由于其具有众多优点及计算机技术的快速发展,在近30年间已经得到了极大的发展,并被广泛地应用于假设检验、参数估计、结构方程、典型相关分析等各个研究领域。当然,内部重复验证结果只是外部重复结果的必要而非充分条件。
2007年,Zientek和Thompson首次把Bootstrap方法应用到探索性因素分析中,提出了Bootstrap探索性因素分析方法。Bootstrap探索性因素分析方法对分布的假设比较宽松,要求样本能够代表总体,克服了传统的探索性因素分析方法难以提供研究结果可重复的概率等不足,可直接评估研究结果的可重复性,告诉研究者研究结果是否可靠、在某一样本得到的研究结果能否推广到同一总体的其他样本中。文章将详细介绍Bootstrap探索性因素分析法的基本思想和步骤,并辅以实例,说明Bootstrap探索性因素分析在心理学研究中的应用。
2 Bootstrap探索性因素分析的基本思想及步骤
2.1 Bootstrap探索性因素分析的基本思想
Bootstrap探索性因素分析的核心技术是Bootstrap方法,依据的是resampling思想,即有放回抽样:意味着从原始样本中得到一个观测值以后,将之放回,再抽取下一个观测值,结果,任何一个观测值都有可能不止抽到一次,或者一次也没有抽到。每一个重复抽样样本大小等同于原始的随机样本。
Bootstrap探索性因素分析基本思想是:假设有一个实际观测到的样本量为n的数据样本,称之为原始样本,从这个原始样本中有放回地随机抽取n个观测值组成一个新样本,称之为Bootstrap样本;利用这个被抽到的Bootstrap样本,按照传统探索性因素分析中的因子抽取方法、Procrustes因子旋转,计算出所需要的统计量:特征值、模式/结构系数(Pattern/ Structure Coefficients);如此反复抽样和估计,最后由估计出的统计量:特征值、模式/结构系数的值分别形成各自的Bootstrap分布,利用这两个Bootstrap分布来反映特征值、模式/结构系数各自的抽样分布。
Bootstrap样本之于样本,类似于样本之于总体。原始样本代表总体,所以从这一原始样本中抽取出的Bootstrap样本代表着从该总体中抽取的多个样本。一个统计量的Bootstrap分布是基于多个重复抽样样本的,代表基于多个样本的该统计量的抽样分布。某统计量的所有Bootstrap样本的均值的标准差就是该统计量的标准误(SE)。
2.2 Procrustes因子旋转
Procrustes因子旋转也称为目标旋转(Target Rotation),先设定一个目标矩阵,然后使得所有变量经旋转后在目标矩阵处于最佳的拟合位置,得Bootstrap模式/结构系数。目标矩阵即所有重复抽样样本的单一共同因子空间,主要有三种:1)原始样本的极大方差旋转矩阵;2)依据原始样本极大方差旋转矩阵计算而来的、由+1、-1和0建构而成
显示全部