某中心对话式AI任务挑战赛第二届冠军揭晓
葡萄牙NOVA科技大学团队凭借整体表现荣获第一名,获得50万美元奖金。该赛事致力于解决对话式AI领域最复杂的难题——创建能够满足用户完成复杂任务时动态需求的下一代对话体验。
TaskBot是首个融合多模态用户体验的对话式AI挑战赛。赛事期间,配备Echo Show或Fire TV设备的用户除语音指令外,还可获得分步指导、图像或图表等视觉辅助。
某中心对话式AI应用科学经理Michael Johnston表示:“最令人鼓舞的突破在于大语言模型在对话管理本身的应用。团队不仅用LLM生成候选回复,更探索了让指令追踪型LLM驱动整个对话的技术方案。解决任务辅助领域的这一难题,是顶尖机器人表现自然流畅的关键因素。”
由João Magalhães指导的TWIZ团队因综合表现优异获得冠军奖金。Magalhães指出:“团队在设计突破性TWIZ大语言模型时展现出非凡创造力。基于视频内容的对话将用户体验提升至全新高度,本次赛事开创的视频对话技术具有巨大探索空间。”
本届赛事扩展了涵盖的业余爱好与家庭活动类型。参赛团队需在屏幕可用时,为每个对话轮次创新性整合视觉辅助工具。视觉辅助呈现方式的改进以及视觉与语音模态的协调能力均被纳入评分标准。
TWIZ团队负责人Rafael Ferreira强调:“TaskBot中的用户对话具有独特性,为手动任务执行提供了新视角。通过分析这些对话,我们发现TWIZ技术能实现更贴合语境、更具洞察力的对话引导。”
格拉斯哥大学GRILL团队获得第二名10万美元奖金,匹兹堡大学ISABEL团队获得第三名5万美元奖金。前三名团队及其他参赛者的研究成果已形成系列论文发表。
GRILL团队负责人Sophie Fischer表示:“参与本届挑战赛让我们获得开发部署尖端语言模型的独特机会。关键不在于模型规模或训练改进,而在于通过创新应用方式切实帮助用户。”
今年初有五支大学团队晋级决赛阶段。选拔标准包括用户反馈和各团队技术论文的科学价值。另两支决赛团队分别是弗吉尼亚理工大学的PLAN-Bot团队与加州大学圣克鲁兹分校的Sage团队。
Johnston补充道:“与往届相比,生成式AI和大语言模型的应用广度令人瞩目。以往赛事使用早期语言模型生成候选回复,而如今团队利用高容量指令追踪模型完成意图分类、搜索查询构建、合成数据集创建、任务描述生成等多样化任务。团队还探索了通过屏幕界面帮助用户澄清需求的交互方式,并开始增加辅助技术功能以扩展服务覆盖范围。”
用户通过Echo或Fire TV设备与大学团队的机器人交互。用户评分和反馈帮助参赛团队持续优化系统。每支入选团队获得25万美元研究经费、智能设备、云计算服务、科学家指导、CoBot工具包以及自动语音识别、神经响应生成模型、对话数据集等技术资源。
赛事期间,用户启动交互后会收到正在与参赛机器人对话的提示。对话结束后系统会邀请进行语音评分并提供额外反馈。所有交互数据和评分均共享给团队用于改进系统,同时作为晋级半决赛和决赛的评判依据。
埃默里大学计算机科学教授Eugene Agichtein指出:“第二届赛事中部分机器人的性能相比首届实现巨大飞跃。这得益于首届赛事积累的经验数据与模型,结合LLM技术的持续进步。”
2022年首届赛事冠军由格拉斯哥大学GRILLBot团队获得,葡萄牙NOVA科技大学与俄亥俄州立大学团队分获二三名。