南湖新闻网讯(通讯员 邓 昊 )近日,我校理学院陈洪教授课题组以“Sparse Modal Additive Model” 为题,在人工智能知名期刊IEEE Transactions on Neural Networks and Learning Systems(IEEE TNNLS)发表研究论文。文章结合众数回归、可加模型和数据依赖假设空间提出了一类新的稳健可解释学习模型,建立了模型的理论分析和经验评价,为复杂噪声数据的稳健估计和变量选择提供了新方法。
如何从高维复杂数据中挖掘有价值信息一直是统计与机器学习领域的热点研究问题,开发同时具备可解释性与稳健性的模型是解决此问题的有效途径之一。当前,面向高维数据的可解释模型大多以学习条件均值为目标,在非高斯噪声数据处理中往往会出现性能的退化。
针对该问题,研究以学习条件众数为目标,在结构风险最小化框架下融合众数度量、可加假设空间和系数正则来构建稳健可加模型。该模型能实现面向复杂噪声数据的稳健、可解释学习,且能有效克服高维数据导致的维数灾难问题。理论上,研究者结合误差分解与集中估计技术建立了模型的泛化误差界与变量选择一致性分析,推广并提升了相关的收敛分析结果。应用上,在模拟和真实数据实验中从逼近能力、可解释性、稳健性等多角度验证了构建模型的出色性能。
该模型与相关方法的理论性质可总结如下表:
图片1
该研究是陈洪教授前期CCF A人工智能顶会工作(H.Chen,X.Wang and H. Huang, NIPS, 2017; X.Wang, H.Chen and H.Huang, NIPS,2017;G.Liu,H. Chen and H. Huang, ICML, 2020)的进一步延续和深入,得到了国家自然科学基金面上项目等的资助。理学院陈洪教授为论文第一作者,信息学院博士生王英杰为第二作者,南方科技大学郑锋助理教授与西安电子科技大学邓成教授为论文通讯作者。
论文链接:https://ieeexplore.ieee.org/document/9146743
审核: 石 峰