ICLR 2024人工智能技术前沿探索

本文详细介绍某研究机构在ICLR 2024会议上展示的70余篇论文,涵盖AI智能体开发、多模态学习、代码生成优化等前沿技术,包括WebAgent网页任务处理、DyST动态场景转换、ExeDec代码分解方法等创新成果。

某研究机构在ICLR 2024的技术展示

问题解决智能体与类人方法

大型语言模型(LLM)正在彻底改变先进AI工具,但其全部潜力尚未完全开发。例如,能够采取有效行动的基于LLM的AI智能体可以将数字助手转变为更有用和直观的AI工具。

通过口头演示介绍了WebAgent,这是一个由LLM驱动的智能体,通过自我经验学习来导航和管理真实网站上的复杂任务。为了进一步提升LLM的通用实用性,重点提升了它们的问题解决能力。通过为基于LLM的系统配备传统的人类方法:产生和使用"工具"来实现这一目标。

另外还提出了一种训练技术,确保语言模型产生更一致的社会可接受输出。该方法使用代表社会价值的沙盒排练空间。

视觉与编码领域的边界突破

动态场景转换器(DyST)模型利用真实世界的单摄像头视频提取场景中物体的3D表示及其运动。DyST还能够生成同一视频的新版本,用户可以控制摄像机角度和内容。

模拟人类认知策略也能产生更好的AI代码生成器。当程序员编写复杂代码时,他们通常将任务"分解"为更简单的子任务。通过ExeDec,引入了一种新颖的代码生成方法,利用分解方法来提升AI系统的编程和泛化性能。

在另一篇重点论文中,探索了机器学习的新用途,不仅生成代码,还优化代码,引入了用于代码性能稳健基准测试的数据集。代码优化具有挑战性,需要复杂的推理,我们的数据集使得能够探索一系列ML技术。结果表明,由此产生的学习策略优于人工编写的代码优化。

基础学习的推进

研究团队正在应对AI的重大问题——从探索机器认知的本质到了解先进AI模型如何泛化——同时努力克服关键的理论挑战。

对于人类和机器来说,因果推理和预测事件的能力是密切相关的概念。在重点演示中,探索了基于预测的训练目标如何影响强化学习,并与大脑活动中也与预测相关的变化进行了比较。

当AI智能体能够很好地泛化到新场景时,是否因为它们像人类一样学习了世界的潜在因果模型?这是高级AI中的一个关键问题。在口头演示中揭示了此类模型确实学习了导致其训练数据的过程的近似因果模型,并讨论了深层含义。

AI中的另一个关键问题是信任,这部分取决于模型如何准确估计其输出的不确定性——这是可靠决策的关键因素。在贝叶斯深度学习中的不确定性估计方面取得了重大进展,采用了一种简单且基本上免费的方法。

最后探索了博弈论的纳什均衡(NE)——在这种状态下,如果其他玩家保持策略不变,没有玩家能从改变策略中受益。除了简单的两人游戏外,即使近似纳什均衡在计算上也是难以处理的,但在口头演示中揭示了从扑克到拍卖交易谈判的最新方法。

凝聚AI社区

很高兴赞助ICLR并支持包括Queer in AI和Women In Machine Learning在内的倡议。这样的合作伙伴关系不仅加强了研究合作,还培养了AI和机器学习领域充满活力的多元化社区。

如果在ICLR现场,请务必访问展位和隔壁的某研究机构同事。发现开创性研究,与举办研讨会的团队会面,并与在整个会议期间进行演示的专家互动。期待与您联系!

会议信息

  • 会议:ICLR 2024
  • 地点:奥地利维也纳Messe Wien会议中心
  • 时间:2024年5月7-11日
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计