主成分分析的基本条件:
设相关矩阵为R以及与之同阶的单位矩阵为I、原始变量的个数为m,则R就是m阶方阵,特征值为λ,求各特征值λi的过程就是求解下列特征方程:|R-λI|=0, 此方程的左边展开后实际上是一个λ的m阶多项式,其解由大到小依次排列为λ1≥λ2≥…≥λm>0。主成分分析的基本条件与主成分的基本性质可概述如下:
①各主成分之间互不相关,若原变量服从正态,则各主成分之间互相独立;
②全部m个主成分所反映的n例样品的总信息,等于m个原变量的总信息。信息量的多少,用变量的方差来度量。若将m个原变量标准化后,每个变量的方差都为1,故方差之和为m,此时,求得的m个主成分的方差之和也为m;
③各主成分的作用大小是∶Z1≥Z2≥…≥Zm;
④第i个主成分的贡献率是(λi/m)×100%;
⑤前P个主成分的累计贡献率是((∑Pi=1λi)/m)×100%。在应用时,一般取累计贡献率为70~85%或以上所对应的前P个主成分即可。 在资料所含的变量个数、样品数及累计贡献率固定的前提下,P/m的比值越小,则说明此资料用主成分分析越合适。
⑥r(Zi,xj)=cij,说明第i个主成分Zi与第j个标准化变量xj之间的相关系数就是表达式(3)中的系数cij;
⑦∑mj=1r2(Zi,xj)=λi,说明第i个主成分Zi与m个标准化变量中的每一个变量之间的相关系数的平和为由大到小排列后的第i个特征值λi;
⑧∑mi=1r2(Zi,xj)=1,说明m个主成分分别与第j个标准化变量的相关系数的平和为1,即每1个标准化变量的信息由全部主成分完全包含。