主分量变换,是指由原始图像数据协方差矩阵的特征值和特征向量建立起来的变换核,将光谱特征空间原始数据向量投影到平行于地物集群椭球体各结构轴的主成分方向,突出和保留主要地物类别信息,用来进行图像增强、特征选择和图像压缩的处理方法。
主分量变换也称K-L变换,是一种线性变换,是就均方误差最小来说的最佳正交变换;是在统计特征基础上的线性变换。对于遥感多光谱图像来说,波段之间往往存在很大的相关性,从直观上看,不同波段图像之间很相似。从信息提取角度看,有相当大的数据量是多余的,重复的。
进行主分量变换等特征变换的目的是将原始图像通过一定的数字变换生成一组新的特征图像,这一组新图像信息集中在少数几个特征图像上,这样,数据量有所减少,达到消除相关系数,进行有效的特征选择和减少波段特征空间维数,达到数据压缩的目的。
主分量变换也叫主成份分析或者主分量分析。是在统计特征基础上的一种多维(如多波段)正交线性变换。变换依据的准则是最小均方误差(K-L准则),即使经过反变换而恢复的影像X与原影像之间的均方差最小。K-L 变换能够把原来多个波段中的有用信息尽量集中到数目尽可能少的特征图像组中去,达到数据压缩的目的;同时,K-L 变换还能够使新的特征图像之间互不相关,也就是使新的特征图像包含的信息内容不重叠,增加类别的可分性。
1、 计算多光谱图像的均值向量M和协方差矩阵∑。
2、计算矩阵∑的特征值λr和特征向量φr(r=1,2,…,m),m为多光谱图像的波段数。
3、将特征值λ,按由大到小的次序排列,即λ1>λ2>...>λm。
4、选择前n个特征值对应的n个特征向量构造变换矩阵Φn。
5、根据Y=ΦnX进行变换,得到的新特征影像就是变换的结果,X为多光谱图像的一个光谱特征矢量。
进行主分量变换计算后,新的特征图像组Y就是一个特征维数得到压缩的n维特征矢量(n<m)。原始数据经过主分量变换后,其方差分布主要集中在前面几个特征,方差的大小反映了模式的散布情况。由于特征向量的方向指向特征空间中集群分布的结构轴方向,所以该变换的几何意义是把原始特征空间的特征轴旋转到平行于混合集群结构轴的方向上去。使得第一主分量方差分布最广,集中最多信息,第二分量次之。
1、变换后的矢量Y的协方差矩阵是对角阵,对角矩阵表明新特征矢量之间彼此不相关。
2、经过主分量变换后得到几个变量,可以证明此时具有的均方误差在所有正交变换中是最小的。由于n<m,这样就用比较少的变量代替了原来的几个变量,实现了数据压缩。主分量变换后,有的特征影像反差拉大,信息集中,整个影像上离散度变大;而另一些特征影像上离散度变小,出现更多的噪声。