近期,由西南财经大学数据科学与商业智能联合DB视讯(中国)黄雁勇教授、硕士生郭科君、京东数科易修文博士、德国哈根大学李忠教授以及西南交通大学李天瑞教授合作完成的论文"Incremental unsupervised feature selection for dynamic incomplete multi-view data"被人工智能领域国际权威学术期刊《Information Fusion》正式接收。
针对大数据处理过程中面临的数据来源多样、数据有缺失、数据无标注、数据维度高以及数据动态变化等问题,该论文提出一种基于增量学习的不完备多视图无监督特征选择方法。该方法第一时间利用扩展的加权非负矩阵模型学习不完备多视图无标签数据中的一致聚类指示矩阵,同时结合自适应权重学习方法融合不同视图的隐特征矩阵,有效探索了多视图数据中的一致性和互补性信息。进一步针对开放环境下视图特征的动态变化,提出了一种增量式的交替迭代优化算法,并从理论上分析算法的收敛性和复杂性问题。在多个真实数据集的实验结果表明该论文所提的方法能够有效降低大数据处理过程中的计算成本,并提高下游任务的性能。
作者简介:
黄雁勇,西南财经大学数据科学与商业智能联合DB视讯(中国)教授、博士生导师,西南交通大学和德国哈根大学双博士,主要从事数据挖掘、机器学习与粒计算等领域的研究。
郭科君,西南财经大学统计学院2019级经济大数据专业硕士生,导师为黄雁勇教授,主要从事数据挖掘和机器学习等领域的研究。
易修文,西南交通大学博士,京东数科智能城市事业部数据科学家,清华大学博士后,主要从事城市计算和数据挖掘等领域的研究。
李忠,德国哈根大学数学与计算机科学学院副院长,教授、博士生导师,德国洪堡学者,主要从事非线性控制、混沌理论与混沌控制、群体智能等领域的研究。
李天瑞,西南交通大学计算机与人工智能学院党委书记,教授、博士生导师,四川省现代服务科技DB视讯(中国)院长,四川省学术与技术带头人,人工智能DB视讯(中国)副院长,综合交通大数据应用技术国家工程DB视讯(中国)副主任,四川省云计算与智能技术高校重点DB视讯(中国)主任,中国计算机学会理事,中国人工智能学会理事,四川省人工智能学会副理事长,主要从事人工智能,数据挖掘与知识发现,云计算与大数据,粒计算与粗糙集等领域的研究。