你好,游客 登录 注册
背景:
阅读正文

因子分析

[日期:2011-11-16] 来源:  作者:辽宁省科学技术厅科技统计中心 [字体: ]

 因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。

因子分析的内容十分丰富,这里仅介绍因子分析常用一种类型:R型因子分析(对变量做因子分析)。

基本思想:因子分析的基本思想是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性(或相似性)的大小把变量(或样品)分组,使得同组内的变量(或样品)之间相关性(或相似性)较高,但不同组的变量相关性(或相似性)较低。

R型因子分析数学模型:

 

 用矩阵表示:=

 

 

 

 简记为   

 

 且满足

 

  是不相关的;

 不相关且方差皆为1

 

          不相关,且方差不同。

 

 

 其中 是可实测的个指标所构成维随机向量,是不可观测的向量,称为的公共因子或潜因子。称为因子载荷是第个变量在第个公共因子上的负荷。矩阵称为因子载荷矩阵;称为的特殊因子,通常理论上要求的斜方差阵是对角阵,中包括了随机误差

因子分析和主成分分析的区别:主成分分析的数学模型实质上是一种变换,而因子分析模型是描述原指标斜方差阵结构的一种模型。另外,在主成分分析中每个主成分相应的系数是唯一确定的。与此相反,在因子分析中每个因子的相应系数不是唯一的,即因子载荷不是唯一的。

 因子模型中公共因子,因子载荷和变量共同度的统计意义:

 假定因子模型中,各个变量以及公共因子、特殊因子都已经是标准化(均值为0,方差为1)的变量。

 1)因子载荷的统计意义:因子载荷的统计意义就是第个变量与第个公共因子的相关系数即表示依附于的分量(比重)。它反映第个变量在第个公共因子上的相对重要性。

 2)变量共同度的统计意义:变量的共同度定义为因子载荷阵中第行元素的平方和,即   ,为了说明它的统计意义,将下式两边求方差,即

 

    

 由于已经标准化了,所以有

 

 此式说明变量的方差由两部分组成:第一部分为共同度,它刻划全部公共因子对变量的总方差所作的贡献,越接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了。

 3)公因子的方差贡献的统计意义

将因子载荷矩阵中各列元素的平方和记为 

 

 为公共因子的贡献,即表示同一公共因子对诸变量所提供的方差贡献之总

 和,它是衡量公共因子相对重要性指标。

 因子分析的计算步骤:

 第一步:将原始数据标准化,为书写方便仍记为

 第二步:建立变量的相关系数阵

其中

 

 

 

 第三步:求R的特征根及相应的单位特征向量,分别记为   

 

 根据累计贡献率的要求比如,取前个特征根及相应的特征向量写出因子载荷阵:

 

 第四步:对A施行方差最大正交旋转。建立因子分析数学模型的目的不仅要找出公共因子以及对变量进行分组,更重要的是要知道每个公共因子的意义,以便对实际问题做出科学的分析,如果每个公共因子的含义不清,不便于进行实际背景的解释,这时根据因子载荷阵的不唯一性,可对因子载荷阵实行旋转即用一个正交阵右乘A(由线性代数知道一个正交变换,对应坐标系的一次旋转)使旋转后的因子载荷阵结构简化,便于对公共因子进行解释。所谓结构简化就是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上的载荷比较小,至多是中等大小。这种变换因子载荷阵的方法称为因子轴的旋转,而旋转的方法有多种,如正交旋转,斜交旋转等。

 第五步:计算因子得分。因子分析的数学模型是将变量(或样品)表示为公共因子的线性组合,由于公共因子能反映原始变量的相关关系,用公共因子代表原始变量时,有时更有利于描述研究对象的特征,因而往往需要反过来将公共因子表示为变量(或样品)的线性组合,即   称上式为因子得分函数。用它来计算每个样品的公共因子得分。这样就可以在二维平面上作出因子得分的散点图,进而对样品进行分类或作为下一步分析原始数据时对问题作更深入的研究。

收藏 推荐 打印 | 录入:jinting | 阅读:
相关文章      
热门评论