关于因子分析

因子分析是模式识别中降维的一个重要方法,它把具有相关性的多个特征参数去相关性,提取出因子进行分析,有效的减少了计算量,但通过 SPSS 实验发现,如果进行因子分析后,得到的因子对分类的贡献值不相同,通过碎石图可以看到少量因子对聚类贡献大,更多的因子对聚类贡献小,如果把它们同等对待进行下一步的聚类(如 k-means 聚类)会严重影响聚类结果,导致还不如用一个因子进行聚类。下面是计算因子的方法:

 \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} = \begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{pmatrix} \begin{pmatrix} F_1 \\ F_2 \\ \vdots \\ F_k \end{pmatrix} + \begin{pmatrix} c_1 \\ c_2 \\ \vdots \\ c_k \end{pmatrix}

X_{nx1}=A_{nxk}F_{kx1}+c_{nxi}

X 为可实测的 n 维随机向量,它的每个分量代表一个指标或者变量。F 为不可观测的 K 维随机向量,它的各个分量将出现在每个变量中,所以称它们为公共因子,矩阵 A 称为因子载荷矩阵,a_{ij}为载荷因子,变量 c 称为随机因子,包括随机误差。值得注意的是 F 中每个分量的公共因子的重要程度可以通过碎石图看到(越重要,值越大,对聚类影响更大):

附件

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据