11月16日,第十届全国高校研究生统计论坛在中国人民大学圆满举办。此次论坛得到了来自全国各高校师生的广泛支持和积极参与,涉及领域包括经济社会统计、数理统计、风险管理与精算、生物统计与流行病学、数据科学与大数据统计五个方向。经过评审委员会专家的匿名评审,共有47篇论文入选,并从中精选出10篇“十佳论文”。
我院2023级博士生饶昊宸凭借题目为“Estimation and Inference for Density-convoluted Support Vector Machine with Streaming Data”的学术报告(指导老师:郭旭教授),荣获本届论坛“十佳论文”,并在论坛主会场进行现场报告。
该论文研究了密度卷积支持向量机(DCSVM)在高维流数据下的系数估计和推断问题。首先,本文提出了一种针对流数据的可更新lasso估计量,它可以通过优化二次逼近后得到的代理损失函数来获得。这一估计过程只需要当前的数据集,和有限的、可更新且便于存储的历史信息,并在理论上给出该估计的误差界。为了构造有效的推断方法,本文进一步提出了在线纠偏lasso估计量,并建立了相应的渐近正态性。数值计算方面,本文考虑了对高维模型可行且计算效率高的近似点梯度下降算法,并提供了表现良好的模拟和实际数据分析结果。
全国高校研究生统计论坛由中国人民大学统计学院和全国高校学生创新统计联盟共同发起,自2015年起每年举办一届。论坛旨在汇聚优秀青年统计人才,交流探讨统计学科在新技术、新领域、新问题的研究成果,以加快培养中国特色统计学科领军及拔尖创新人才,并推动构建统计学科自主知识体系。