1、关键点
综述:主成份剖析 因子剖析 典型相关剖析,三种方式的共同点主要是拿来对数据聚类处理的 从数据中提取个别公共部份,然后对这种公共部份进行剖析和处理。
#主成份剖析 是将多指标化为少数几个综合指标的一种统计剖析方式
主成份剖析是一种通过聚类技术把多个变量化成少数几个主成份的方式,这些主成份才能反映原始变量的大部分信息,他们一般表示为原始变量的线性组合。
2、函数总结
#R中作为主成份剖析最主要的函数是princomp()函数
#princomp()主成份剖析可以从相关阵或则从协方差阵做主成份剖析
#summary()提取主成份信息
#loadings()显示主成分剖析或因子剖析中荷载的内容
#predict()预测主成份的值
#screeplot()画出主成份的砂砾图
#biplot()画出数据关于主成份的散点图和原座标在主成份下的方向
3、案例
#现有30名学生净高、体重、胸围、坐高数据,对身体的四项指标数据做主成分剖析。
#1.载入原始数据
testX1=c(148, 139, 160, 149, 159, 142, 153, 150, 151, 139,
140, 161, 158, 140, 137, 152, 149, 145, 160, 156,
151, 147, 157, 147, 157, 151, 144, 141, 139, 148),
X2=c(41, 34, 49, 36, 45, 31, 43, 43, 42, 31,
29, 47, 49, 33, 31, 35, 47, 35, 47, 44,
42, 38, 39, 30, 48, 36, 36, 30, 32, 38),
X3=c(72, 71, 77, 67, 80, 66, 76, 77, 77, 68,
64, 78, 78, 67, 66, 73, 82, 70, 74, 78,
73, 73, 68, 65, 80, 74, 68, 67, 68, 70),
X4=c(78, 76, 86, 79, 86, 76, 83, 79, 80, 74,
74, 84, 83, 77, 73, 79, 79, 77, 87, 85,
82, 78, 80, 75, 88, 80, 76, 76, 73, 78)
#2.作主成份剖析并显示剖析结果
test.pr
当cor=FALSE表示用样本的协方差阵S做主成份剖析
summary(test.pr,loadings=TRUE)#loading是逻辑变量 当loading=TRUE时表示显示loading 的内容
#loadings的输出结果为荷载 是主成份对应于原始变量的系数即Q矩阵
分析结果涵义
#----Standard deviation 标准差其平方为残差=特征值
#----Proportion of Variance残差贡献率
#----Cumulative Proportion方差累计贡献率
#由结果显示 前两个主成份的累计贡献率早已达到96% 可以舍弃另外两个主成份 达到聚类的目的
因此可以得到函数表达式 Z1=-0.497X'1-0.515X'2-0.481X'3-0.507X'4
Z1=0.543X'1-0.210X'2-0.725X'3-0.368X'4
#4.画主成份的砂砾图并预测
screeplot(test.pr,type="lines")
由砂砾图可以看出 第二个主成份以后 图线变化趋向平稳 因此可以选择前两个主成份做剖析