近日,实验室四篇论文被国际人工智能顶级会议NeurIPS 2023录用。分别是事件相机表示学习方面的论文” E2PNet: Event to Point Cloud Registration with Spatio-Temporal Representation Learning”、多智能体强化学习方面的论文“RiskQ: Risk-sensitive Multi-Agent Reinforcement Learning Value Factorization”、面向连续型动态图表示学习方面的论文“ESSEN: Improving Evolution State Estimation for Temporal Networks using Von Neumann Entropy”、深度超分模型方面的论文“Learning Re-sampling Methods with Parameter Attribution for Image Super-resolution”。
NeurIPS(全称 Neural Information Processing Systems)是人工智能、机器学习、计算神经科学领域的顶级学术会议。NeurIPS会议成立于1987年,今年是第37届会议,大会讨论的内容包含深度学习、强化学习、计算机视觉、大规模机器学习、学习理论、优化、稀疏理论等众多细分领域。
E2PNet: Event to Point Cloud Registration with Spatio-Temporal Representation Learning
ASC实验室和英特尔公司合作,以“E2PNet: Event to Point Cloud Registration with Spatio-Temporal Representation Learning” 为题被录用了一篇关于事件相机表示学习与事件-三维点云模型注册研究成果的论文。
作为一种新型异步视觉传感器,事件相机具有极高的时间分辨率和动态范围,能高性价比地应用于高速、高动态场景。在事件相机中,各像素对超过阈值的光照变化进行异步脉冲响应。这一独特的异步数据流对现有的同步数据处理方式带来了新的挑战。传统的事件相机相关算法通常利用简单统计方法获取事件整体统计信息作为特征;或者设计特殊的脉冲响应函数对各像素产生的事件进行类卷积操作,从而模拟传统相机的曝光成像过程以获得“事件图像”。虽然这些操作将异步非结构化的事件数据转变成同步的网格化特征张量,从而便于后续任务的处理,但是在事件表示过程中损失了大量的时间细节与时空关联信息,不利于高速、高动态场景。
针对这一问题,该论文提出将原始事件相机数据建模为特殊时空点云,使用基于点的学习方法自适应地提取重要的时间细节和时空关联信息,并将其表示为网格化特征向量。论文提出的时空分离注意力机制有效的克服了事件数据中时间与空间维度的不同物理意义、量纲、分布带来的挑战,并且能够以模块化方式嵌入现有事件相机相关算法中。提出的事件学习表示模块可结合后续任务进行端到端学习达到更好的性能。论文在事件-三维点云模型注册任务的多个场景中进行了充分实验,证明了本文表示学习方法的有效性。同时,该方法直接嵌入各类基于事件相机的光流估计、目标识别等任务中同样取得了性能提升,证明了该方法在其他任务中具有泛化性。
该论文第一作者是ASC实验室博士生林修弘和硕士生邱畅杰(共同一作),通讯作者是沈思淇老师,其他作者还有ASC实验室王程老师、臧彧老师、刘伟权博士,英特尔公司蔡志鹏博士、Matthias Müller博士。
RiskQ: Risk-sensitive Multi-Agent Reinforcement Learning Value Factorization
ASC实验室和国防科技大学计算机学院师生合作,以“RiskQ: Risk-sensitive Multi-Agent Reinforcement Learning Value Factorization” 为题被录用了一篇关于多智能体强化学习研究成果的论文。这个工作是ASC实验室NeurIPS 2022年亮点论文ResQ的扩展和深化。
传统的多智能体价值分解算法普遍通过最大化Q值(价值分布的期望)来选取智能体的最优动作。但是在具有高度不确定性的多智能体环境中,由于存在着一些会带来极高/低奖励的小概率事件,因此最大化期望值的算法并不总能保证得到最优解。针对这一问题,该论文对多智能体协同强化学习中常用的个体全局最优化原则(IGM)进行了扩展,提出了风险敏感的个体全局最优化原则(RIGM),并在理论上证明了现有的主流价值分解算法无法满足RIGM原则。之后,该论文提出了RiskQ(基于风险函数的价值分解方法),将联合价值分布建模为个体价值分布的带权分位数混合的形式,通过理论验证其能够满足RIGM原则,且适用于任意扭曲风险指标(Distorted Risk Measure)。论文在悬崖环境、跟车环境以及包含星际争霸游戏的多个场景中进行了充分实验,证明了RiskQ方法的有效性。
该论文第一作者是ASC实验室沈思淇老师,通讯作者是国防科技大学符永铨老师,ASC实验室2022级硕士生马陈楠、2022级硕士生李超分别为学生一作和学生二作,其他作者还有ASC实验室刘伟权博士、王程老师,国防科技大学梅松竹老师、刘新旺老师。
ESSEN: Improving Evolution State Estimation for Temporal Networks using Von Neumann Entropy
该论文面向连续型动态图表示学习提出了一种改善演化状态评估的网络表示模型ESSEN(Evolution StateS awarE Network)。在连续型动态图中,演化状态评估面临两大挑战:(1)网络演化多变性挑战。不同的网络呈现多样的演化速度和状态,无法一概而论;(2)网络膨胀性挑战。随着时间的推移,网络演化趋于复杂,链路大幅增长,使得基于结构的评估方法在时间和空间上需要承担巨大代价。本文首次在连续型动态图领域引入了量子类比下的冯诺依曼熵进行演化状态评估。具体来说,考虑到冯诺依曼熵在大型网络中拉普拉斯矩阵计算的高复杂度与动态网络的多变性,本文对网络拓扑结构进行投影,使用冯·诺依曼熵的近似推导式进行计算,使得熵的最终表达式与图上度分布的二次多项式关联,在较低的代价下实现演化状态感知。同时,进一步提出了虚拟演化算法、熵感知注意力机制和混合热力学专家评估模块,提高模型对不同演化状态下图的泛化表示能力。实验结果表明,模型在多个数据集上的直推式和归纳式链路预测都取得了目前最优的性能表现。
该论文由厦门大学信息学院软件工程系硕士生黄祺尧和张莹玥,通讯作者是张志宏副教授,其他作者还有Edwin Hancock教授合作完成。
Learning Re-sampling Methods with Parameter Attribution for Image Super-resolution
目前主流的深度超分模型主要关注网络架构设计以及优化策略,忽略了对训练数据的关注。事实上,大多数超分方法都是在整幅图像上通过随机采样图像块对来训练模型。然而,图像内容的不均匀性使得训练数据呈现不平衡分布,即易重构区域(平滑)占据了大部分数据,而难重构区域(边缘或纹理)的样本很少。基于这一观测,该论文考虑重新思考当前仅使用统一数据采样方式训练超分模型的范式。因此,提出了一种简单而有效的双采样参数归因方法,其中双采样包括均匀采样和反转采样,通过引入反转采样来调和不平衡的数据偏差。前者旨在保持数据的原始分布,后者旨在增强模型对困难样本的特征提取能力。此外,引入积分梯度对两种采样数据交替训练的模型中每个参数的贡献进行归因,从而筛选出不重要的参数进行进一步细化。通过逐步解耦参数的分配,超分模型可以学习到更紧凑的表示。在公开数据集上的实验表明,该论文所提方法可以显著提升基线模型的性能。
该论文第一作者是厦门大学信息学院计算机科学与技术系2020级博士生罗小同,通讯作者是曲延云教授,其他作者还有华东师范大学谢源教授。
| © 2014-2021 福建省智慧城市感知与计算重点实验室.版权所有|
地址:厦门市思明区厦门大学海韵园行政楼B602
联系电话:+86-592-258-0003