【光华讲坛】Prior Knowledge Guided Ultra-high Dimensional Variable Screening

主题 Prior Knowledge Guided Ultra-high Dimensional Variable Screening

主讲人:密歇根大学 康健教授

主持人:澳门尼威斯人官网 喻开志教授

时间528日上午1000-1130

举办地点腾讯会议 278 584 206

主办单位:澳门尼威斯人官网 数量经济研究所 科研处


主讲人简介

康健博士,美国密歇根老员工物统计学教授。2005年毕业于北京师范大学,2007年获清华大学数学专业硕士学位,2011年获密歇根老员工物统计专业博士学位。主要从事大规模生物医学数据的统计方法与理论研究,专注于贝叶斯方法和图像统计。他和合作者在JASA, Biometrika, NeuroImageHuman Brain Mapping等顶级统计期刊与医学期刊上发表学术论文80余篇。康健博士同时也是美国统计学会统计成像组的协同主席,美国统计学会会士,顶级统计期刊JASABiometrics and Statistics in Medicine副主编。


内容简介

Variable screening is a powerful and efficient tool for dimension reduction under ultrahigh dimensional settings. However, most existing methods overlook useful prior knowledge in specific applications. In this work, from a Bayesian modeling perspective, we develop a unified variable screening procedure for the linear regression model. We discuss different constructions of posterior mean screening (PMS) statistics to incorporate different types of prior knowledge according to specific applications. With non-informative prior specifications, PMS is equivalent to high-dimensional ordinary least-square projections (HOLP). We establish the screening consistency property for PMS with different types of prior knowledge. We show that PMS is robust to prior misspecifications; and when the prior knowledge provides correct information on summarizing the true parameter settings, PMS can substantially improve the selection accuracy compared to HOLP and other existing methods. We illustrate our method with extensive simulation studies and an analysis of neuroimaging data.

对于超高维数据,变量筛选是一个强有力和有效的维数缩减工具。现有的方法忽视了具体应用中的先验信息。在我们的工作中,基于贝叶斯模型的想法,对线性回归模型我们提出了一种统一的变量筛选程序。根据具体应用场景,结合不同类型的先验知识,我们讨论了不同的后验均值筛选(PMS)统计量的构造问题。在无信息的先验设定下,PMS方法与高维最小二乘投影法(HOLP)等价。在有先验信息设定下,我们建立了PMS方法筛选一致性。对于先验信息错误设定情形,我们提出的PMS方法具有稳健性;对于先验信息提供正确总结了真实参数设定情形,PMS方法可以大幅度提高选择精度,优于HOLP法与其它已有的选择方法。最后,我们用大量的模拟研究与神经影像数据来说明PMS方法的优越性。