《纵向数据分析中的有效统计推断方法及其应用》是依托中国科学技术大学,由张伟平担任项目负责人的面上项目。
纵向数据分析方法在生物医学、流行病学、社会和经济等领域有着广泛的应用和研究。纵向研究中依时间顺序对同一个体进行多次重复观测,因而所得数据本质上具有相关性,这使得我们必须发展能够有效度量重复观测之间相关性的统计方法,才能提高推断效率。本项目主要研究纵向数据分析中的有效统计推断方法。包括均值-协方差矩阵的同时推断方法、协方差矩阵及其逆矩阵的建模与选择、参数与半参数统计模型方法的应用、分位数回归模型中得分函数之间相关性的建模、高维纵向数据和缺失数据下回归均值和协方差矩阵的有效估计等一系列问题。项目的意义在于从均值-协方差矩阵的同时推断角度研究有效的统计推断方法,发展参数与半参数模型、分位数回归模型在纵向数据中的统计推断理论和应用方法,以及高维和缺失数据下的有效统计推断方法。这些研究有利于人们在理解响应变量观测随时间等协变量的变化趋势同时,又能了解个体内部相依关系的变化特点,进行有效统计推断。
纵向数据分析方法在生物医学、流行病学、社会和经济等领域有着广泛的应用和研究。由于纵向研究中依时间顺序对同一个体进行多次重复观测,因此所得数据本质上具有相关性,从而只有能够有效度量重复观测之间相关性的统计方法才能提高推断效率。本项目主要研究纵向数据分析中的有效统计推断方法,包括均值-协方差矩阵的同时推断方法、协方差矩阵及其逆矩阵的建模与选择、参数与半参数统计模型方法的应用、分位数回归模型中得分函数之间相关性的建模、高维纵向数据和缺失数据下回归均值和协方差矩阵的有效估计等一系列问题。在项目研究计划下,课题组提出了对协方差矩阵本身进行无约束的参数化建模方法,获得了回归均值-协方差矩阵的同时参数推断方法;为解决已有方法不能直接对相关系数矩阵进行分解建模的局限性,课题组提出了一种极坐标变换方法,在此基础上,提出了回归均值-相关系数-方差的同时参数推断方法;为提高分位数回归模型中回归系数的推断效率,课题组基于广义矩估计方法提出了一种刻画估计函数之间相依关系的推断方法,并利用引入光滑的方法解决了目标函数数值优化问题;利用纵向观测之间的相依特点和Bayes理论,项目组提出了回归均值-协方差矩阵的同时参数Bayes推断方法;针对缺失数据和存在时间相依协变量情形,项目组提出了一种压缩经验似然估计方法; 对高维协方差矩阵,项目组提出了一种新的有效检验方法;当高维协方差矩阵稀疏时候,项目组研究了稀疏线性判别方向的特征选择问题;此外, 项目组利用概率工具研究了多个随机变量之间相关性的刻画方法及其性质。项目研究成果以学术论文的形式发表在包括顶级学术期刊JRSSB和Biometrika在内的多个著名国际学术期刊上,受到国内外同行的广泛关注。这些研究有利于人们在理解响应变量观测随时间等协变量的变化趋势同时,又能了解个体内部相依关系的变化特点,从而进行有效统计推断。