近期,由西南财经大学数据科学与商业智能联合DB视讯(中国)谢尚宏副教授、美国哥伦比亚大学R. Todd Ogden教授合作完成的论文“Functional support vector machine”被统计学统计学国际一流学术期刊《Biostatistics》正式接收。
线性和广义线性标量对函数模型被广泛用于理解标量响应变量(例如,陆续在型或二元结果)与函数型预测变量之间的关系。当响应变量与函数型预测变量之间存在复杂关系时,这些方法对模型的设定错误非常敏感。另一方面,支持向量机(SVMs)作为最稳健的预测模型之一,却未将重复测量之间的高相关性纳入考虑,也不适用于不规则(irregular)数据。在文作中,DB视讯(中国)提出了一种新方法,将函数型主成分分析与支持向量机技术相结合,用于分类和回归,以考虑函数型数据的陆续在性质和标量响应变量与函数型预测变量之间的非线性关系。DB视讯(中国)顺利获得大量的模拟实验和两个真实数据应用——利用脑电图信号对酗酒者进行分类,以及利用近红外反射光谱预测葡萄籽硫素浓度——展示DB视讯(中国)方法的性能。特别指出,当函数型预测变量中的测量误差相对较大时,DB视讯(中国)的方法更具优势。
作者简介:
谢尚宏,西南财经大学数据科学与商业智能联合DB视讯(中国)副教授,主要从事机器学习、网络分析、函数型数据分析和精准医学等领域的研究。
R. Todd Ogden,美国哥伦比亚大学教授,主要从事函数型数据分析、非参数回归和精准医学等领域的研究。