南湖新闻网讯(通讯员 邓 昊)近日,我校理学院陈洪教授机器学习团队以“Multi-task Additive Models for Robust Estimation and Automatic Structure Discovery”为题,在34th Conference on Neural Information Processing Systems(NeurIPS 2020)发表研究论文。
当前,面向高维数据的可解释模型大多构建在单任务学习框架下,且以学习条件均值为目标。此类模型往往不能直接用于多任务数据,且在非高斯噪声的数据处理中会出现性能的退化。特别地,传统的组稀疏可解释模型严重依赖变量结构的先验信息。针对此类问题,本文在多任务双层优化框架下,通过融合众数回归、可加模型与结构惩罚项,提出了一类新的多任务可加模型。该模型不仅能实现面向复杂噪声数据的稳健估计,而且能够自动地挖掘数据中潜在的变量组结构。优化上,针对模型非凸非光滑的特点,研究者基于半二次优化和前向后向切分算法提出了一类光滑优化策略,并给出了优化算法的收敛分析。应用上,模拟实验和日冕物质抛射实验从模型的估计误差、结构发现能力等多角度验证了构建模型的出色性能。
多任务可加模型与传统组稀疏模型的差异如图1所示:
图1:(a)多任务数据生成过程;(b)传统组稀疏模型;(c)多任务可加模型
该研究是陈洪教授前期CCF A人工智能顶会工作(H. Chen, X. Wang and H. Huang, NIPS, 2017; X. Wang, H. Chen and H. Huang, NIPS,2017;G. Liu, H. Chen and H. Huang, ICML, 2020)和人工智能顶刊工作(H. Chen, Y. Wang, et al., TNNLS 2020)的进一步延续和深入,得到了国家自然科学基金面上项目等的资助。信息学院博士生王英杰为第一作者,理学院陈洪教授为论文通讯作者,南方科技大学郑锋副研究员、国家空间科学中心陈艳红研究员等参与了论文研究工作。
审核:陈洪