IJCAI2025杰出论文奖获奖名单公布
国际人工智能联合会议(IJCAI)杰出论文奖旨在表彰每年会议上展示的最佳论文。在今年会议开幕式上,三篇论文被评选为杰出论文。
获奖论文摘要
结合多目标强化学习与约束螺栓学习规范行为
作者:Emery A. Neufeld, Agata Ciabattoni, Radu Florin Tulcan
规范约束螺栓(NRBs)技术通过适配最初为安全强化学习开发的约束螺栓方法,确保符合社会、法律和伦理规范。虽然有效,但NRBs依赖试错式的权重调整,这限制了其执行分层规范的能力,且规范更新需要重新训练。本研究将NRBs学习重新表述为多目标强化学习问题,将每个规范视为独立目标。由此引入有序规范约束螺栓(ONRBs),支持算法权重选择、优先级规范、规范更新,并提供最小化规范违反的正式保证。案例研究表明,ONRBs为强化学习智能体遵守广泛规范同时实现目标提供了稳健的理论基础。
通过鲁棒压缩边界提升具身AI模型性能
作者:Chong Yu, Tao Chen, Zhongxue Gan
深度学习模型与物理世界融合的快速改进显著提升了具身AI能力。然而,强大的具身AI模型及其规模给部署效率带来日益增长的负担。相较于数据中心,具身AI平台的效率问题更为突出,因其计算资源和内存带宽更为有限。同时,大多数具身AI场景(如自动驾驶和机器人技术)对快速响应更为敏感。理论上,传统模型压缩技术可帮助具身AI模型实现更高效计算、更低内存和能耗以及减少延迟。由于具身AI模型需与物理世界交互,相应压缩模型也需抵抗现实事件导致的自然损坏(如噪声、模糊、天气条件甚至对抗性破坏)。本研究探索提升具身AI模型效率和鲁棒压缩边界的新范式,该方法在真实条件下被证明能在准确性、效率和鲁棒性间找到最优平衡。
基于马尔可夫链算子选择和仅接受恶化算子的超启发式算法加速
作者:Abderrahim Bendahi, Benjamin Doerr, Adrien Fradin, Johannes F. Lutzeyer
移动接受超启发式算法近期被证明能以惊人效率逃离局部最优解。本研究提出对该算法的两项改进,在包括经典CLIFFd和JUMPm函数类的大量基准测试中展示出色性能:(1)通过简单双状态马尔可夫链选择仅改进和任意移动接受算子,该改进将JUMPm函数运行时间从Ω(n²m⁻¹)降至O(nm⁺¹);(2)用仅接受恶化算子替代全移动接受算子。这种反直觉的算子此前未被文献使用,但证明显示该算子能极大帮助逃离局部最优,例如将JUMP函数运行时间降至O(n³logn)且与间隙大小无关。总体而言,本研究证明马尔可夫移动接受超启发式算法在新基准类SEQOPTk所有成员上具有O(nk⁺¹logn)的优异运行时间,该类包含大量具有k个连续局部最优的函数,并包含常用研究的JUMPm和CLIFFd函数(k=2时)。