近日,由我院2020级博士研究生杨伟超、2024届博士毕业生史宏炜、郭旭教授(通讯作者)及南开大学统计与数据科学学院邹长亮教授合作完成的论文“Robust group and simultaneous inferences for high-dimensional single index model”被第38届神经信息处理系统大会(Conference on Neural Information Processing Systems,NeurIPS 2024)录用。
NeurIPS、ICLR (International Conference on Learning Representations,国际学习表征会议)与ICML(International Conference On Machine Learning,国际机器学习大会)被称为国际人工智能与机器学习领域最具影响力的三个会议。NeurIPS也是中国计算机学会(CCF)推荐的A类会议,具有广泛的国际影响力。
论文概述
由于强大的灵活性和可解释性,高维单指标模型受到广泛关注。然而该模型的实际效果会受到异常观察值和重尾数据的负面影响。针对这些问题,本文提出了一种稳健的高维统计推断方法。该方法通过将单指标模型重构为拟线性模型,并对响应变量进行分布函数变换,从而克服这些负面影响。本文对随机误差没有常见的矩条件或者次高斯假定,因此所提方法在重尾随机误差情况下具有显著的稳健性和效率提升。本文基于正交化思想提出了一种稳健的高维群组推断方法。本文得到了统计量的渐近分布和对应的乘子自助检验方法。此外,本文提出了一种稳健的多重假设检验方法,用于识别重要的自变量,并证明所提方法在渐近条件下能够有效控制错误发现率。与现有方法相比,本文所提方法在重尾误差情况下具有更好的数值模拟表现。
作者简介
杨伟超,北京师范大学统计学院2020级博士研究生。主要研究方向为高维统计推断。研究论文发表在Computational Statistics & Data Analysis,Statistica Neerlandica,Communications in Mathematics and Statistics,南开管理评论,NeurIPS等期刊、会议上。
史宏炜,阿尔伯塔大学博士后,博士毕业于北京师范大学统计学院。主要研究方向为高维假设检验。研究论文发表在Statistics and Computing,Communications in Mathematics and Statistics,Journal of Systems Science and Complexity,NeurIPS等期刊、会议上。
郭旭,现为北京师范大学统计学院教授,博士生导师。郭老师一直从事回归分析中复杂假设检验的理论方法及应用研究,近年来皆在对高维数据发展适当有效的检验方法。部分成果发表在JRSSB,JASA,Biometrika,JOE和NeurIPS等期刊会议。担任《应用概率统计》杂志第十届编委和SCI期刊《Journal of Systems Science and Complexity》的青年编委。现主持国家自然科学基金优秀青年基金。曾荣获北师大第十一届“最受本科生欢迎的十佳教师”,北师大第十八届青教赛一等奖和北京市第十三届青教赛三等奖。
邹长亮,南开大学统计与数据科学学院教授、统计研究院院长。主要从事统计学及其与数据科学领域的交叉研究和实际应用。研究兴趣包括:高维数据统计推断、变点和异常点检测、预测性推断等,在统计学和机器学习领域的权威杂志/会议Ann.Stat.,Biometrika,J.Am.Stat.Asso.,J.Mach.Learn.Res.,Math.Program.,ICML/NIPS/AAAI等上发表论文数十篇,入选爱思唯尔“中国高被引学者”。主持基金委优青、杰青、重点项目、重大项目课题和科技部重点研发计划课题等。任教育部科技委委员、全国应用统计专业硕士教学指导委员会委员、中国现场统计研究会副理事长等。