主成份剖析SPSS操作步骤以教材第五章习题8的数据为例,演示并说明主成分剖析的详尽步骤:原始数据的输入注意事项:关键注意设置好数据的类型(数值?字符串?等等)以及小数点后保留数字的个数即可。二.选项操作1. 打开SPSS的“分析”→“降维”→“因子剖析”,打开“因子剖析”对话框(如下图)2. 把六个变量:食品、衣着、燃料、住房、交通和通信、娱乐教育文化输入到左侧的待剖析变量框。3. 设置剖析的统计量打开最右上角的“描述”对话框,选中“统计量”里面的“原始剖析结果”和“相关矩阵”里面的“系数”。(选中原始剖析结果,SPSS手动把原始数据标准差标准化,但不显示下来;选中系数,会显示相关系数矩阵。)。然后点击“继续”。打开第二个的“抽取”对话框:“方法”里选定“主成份”;“分析”、“输出”和“抽取”这三项都选中各自的第一个选项即可。然后点击“继续”。 第三个的“旋转”对话框里,选取默认的也是第一个选项“无”。第四个“得分”对话框中,选中“保存为变量”的“回归”;以及“显示因子得分系数矩阵”。第五个“选项”对话框,默认即可。这时点击“确定”,进行主成份剖析。三.分析结果的剖析根据SPSS输出结果的先后次序挨个介绍1.相关系数矩阵:是6个变量两两之间相关系数大小的方阵。
2.共同度:给出了此次主成分剖析从原始变量中提取的信息,可以看出交通和通信最多,而娱乐教育文化损失率最大。CommunalitiesInitialExtraction乳品1.000.878着装1.000.825燃料1.000.841住房1.000.810交通和通信1.000.919娱乐教育文化1.000.5843.总残差的解释:系统默认残差小于1的为主成份,所以只取前两个,前两个主成分累加占到总残差的80.939%。并且第一主成份的残差是3.568,第二主成份的残差是1.288。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative .56859.47459.4743.56859.47459.47421.28821.46680.9391.28821.46680.9393.60010.00190.9414.3595.97596.9165.1422.37299.2886.043.712100.000Extraction Method: Principal Component Analysis.4. 主成份荷载矩阵:Component MatrixaComponent12交通和通信.925-.252乳品.902.255着装.880-.224住房.878-.195娱乐教育文化.588.488燃料.093.912应当非常注意:这个主成份荷载矩阵并不是主成份的特点向量,也就是说并不是主成份1和主成份2的系数,主成份系数的求法是:各自主成份荷载向量乘以各自主成份特征值的算术平方根。
那么第1主成份的各个系数是向量(0.925, 0.902, 0.880, 0.878, 0.588, 0.093)除以后得到,即(0.490, 0.478, 0.466, 0.465, 0.311, 0.049)(这才是主成份1的特点向量,满足条件:系数的平方和等于1),分别除以6个原始变量标准化以后的变量即为第1主成份的函数表达式:同理可以求出第2主成份的函数表达式。(同学们自己求解!)5. 主成份得分系数矩阵Component Score Coefficient MatrixComponent12乳品.253.198着装.247-.174燃料.026.708住房.246-.152交通和通信.259-.196娱乐教育文化.165.379该矩阵是主成份荷载矩阵乘以各自的残差得来的,实际上是因子剖析中各个因子的系数,在主成份剖析中可以不考虑它。6. 因子得分在步骤一中,第四个“得分”对话框中,我们选中“保存为变量”的“回归”;以及“显示因子得分系数矩阵”。SPSS的输出结果和原始数据一起显示在数据窗口上面:特别提醒:后两列的数据是上海等16个地区的因子1和因子2的得分,不是主成份1和主成份2的得分。
主成份的得分是相应的因子得分减去相应的残差的算术平方根。即:主成份1得分=因子1得分除以3.568的算术平方根 主成份2得分=因子2得分除以1.288的算术平方根四.主成份的得分:把因子1和因子2的数值分别除以各自的残差的算术平方根,得出各地区主成份1和主成份2的得分。 后两列就是这16个地区主成份1和主成份2的得分。(有兴趣的朋友可以验证一下:由步骤3.4推论下来的主成份的函数关系式估算下来的主成份得分是否与该数据栏的得分一致?)五.综合得分及排序:每个地区的综合得分是根据下述公式估算的:, 通分得:。按照此公式估算出各地区的综合得分Y为:按照综合得分Y的大小进行16个地区的排序,结果如下:特别提醒:如果主成份剖析中有n个变量,则特征值(或残差)之和就等于n。特征向量(或主成份的系数)中各个数值的平方和等于1,否则就不是特点向量,也不是主成份系数。步骤3.4中的主成份荷载向量各系数的平方和等于其对应的主成份的残差。在本例中:SPSS没有专门的主成份剖析模块,是在因子剖析模块进行的。它只输出主成份荷载矩阵和因子得分值,而我们最想得到的主成份的系数(特征向量)和主成份得分则须要另外估算。如果估算没有错误,因子1、因子2、主成份1、主成份2和综合得分Y,它们各自的数值之和都等于0。主成份剖析应当估算出综合得分并排序。临沂大学建筑学院房地产系1