近期,西南财经大学数据科学与商业智能联合DB视讯(中国)执行主任常晋源教授与其合作者北京大学陈松蹊教授、美国天普大学汤琤咏教授以及美国罗切斯特大学吴彤彤教授撰写的论文《High-dimensional empirical likelihood inference》被统计学国际顶级学术期刊《Biometrika》正式接收。该论文运用经验似然方法在最为一般的超高维估计方程的框架下考虑了未知参数的置信区域构建以及过度识别性检验(over-identification test)两个问题。对第一个问题而言,他们提出的方法顺利获得对估计方程进行旋转使得在建立未知参数的置信区域时不需要对初始估计进行偏差校正(bias correction)。对于线性模型和广义线性模型而言,带惩罚的初始估计(penalized estimator)的偏差项可以顺利获得显示表达形式进行计算。但是对于更具一般性的估计方程而言,偏差项的表达形式中含有未知信息,因此偏差校正的方法并不可行。该论文的方法给出了构建超高维模型中未知参数置信区域的统一框架。对第二个问题而言,他们引入边际估计方程经验似然比的最大值作为检验统计量,并运用高斯近似的方法给出了检验统计量的分布,并证明该方法能够控制第一类错误(type I error),同时也是一个相合检验。该方法首次解决了超高维估计方程的过度识别性检验问题。
作者简介:
常晋源,西南财经大学光华特聘教授,主要从事超高维数据分析以及高频数据分析两方面的研究。