对话式AI竞赛与社交机器人技术发展

本文介绍了Alexa Prize社交机器人挑战赛的参赛团队经验,探讨了对话系统在心理健康支持、情感交流等领域的应用潜力,以及Transformer模型、常识推理等技术在自然语言处理中的最新进展。

“这项技术将以我们难以理解的方式改变世界”

一位评委和部分Alexa Prize大赛决赛选手谈论了比赛情况、COVID-19的影响以及社交机器人的未来。

人类是社会性生物,对话将我们联系在一起——它使我们能够与重要的人分享从平凡到深刻的一切。在因疫情引发的隔离时代,许多对话已转移到线上,但它们提供的联系仍然至关重要。那么,当你用社交机器人取代对话中的一个人类参与者时会发生什么?与AI助手进行有吸引力的对话意味着什么?这种对话如何证明其价值,它能否提供自己独特的联系?

下一届Alexa Prize挑战赛的申请期现已开放。某中心Alexa Prize团队鼓励所有感兴趣的团队在2020年10月6日太平洋标准时间晚上11:59之前申请第四届大赛。

今年的Alexa Prize竞赛参与者正是被这些问题所驱动。某中心最近宣布,某大学团队赢得了2020年Alexa Prize。我们采访了该团队,以及今年竞赛的一位评委,还有来自其他决赛团队的代表,包括某理工大学、某大学、某加州大学和某圣克鲁兹大学。我们想了解是什么驱使他们参与比赛,COVID-19如何影响了他们的工作,以及他们认为社交机器人未来的可能性和挑战。

问答环节

问:是什么激励您参加今年的比赛?

某大学Emora团队负责人Sarah Fillwock:我们有一群对对话系统研究感兴趣的学生,其中一些人实际上在前几年参加过Alexa Prize,我们都知道Alexa Prize为任何对此类工作感兴趣的人提供了真正独特的机会。使用Alexa设备平台启动社交机器人确实令人兴奋,因为能够每天获得数百个社交机器人与人类用户之间的对话,这确实可以快速评估我们的假设和策略是否提高了对话系统的性能。

某圣克鲁兹大学Athena团队指导教师Marilyn Walker:在我们的自然语言和对话系统实验室,主要研究重点是对话管理和语言生成。对话式AI是一个非常具有挑战性的问题,我们觉得可以在这个领域产生研究影响。该领域最近发展极快,Alexa Prize提供了一个机会,可以在大量Alexa用户群体上尝试对话管理和语言生成的前沿技术。

某圣克鲁兹大学Athena团队负责人Vrindavan Harrison:作为学者,主要关注点是研究。今年的比赛旨在更加以研究为导向,允许团队花更多时间开发新想法。

某加州大学Gunrock团队负责人Kai-Hui Liang:去年比赛的经验激励我们再次加入,因为意识到仍有很大的改进空间。特别感兴趣的是如何找到最能吸引用户的话题,包括尝试不同的方式来引导和推理用户的兴趣。如何检索相关且有趣的内容,并使对话流程更加自然?

某理工大学Alquist团队负责人Jan Pichl:自从Alexa Prize竞赛第一年开始,一直在开发Alquist以提供广泛的话题,更密切地关注最受欢迎的话题。第一个Alquist相当严格地引导用户完成对话。很快意识到需要引入更多灵活性,让用户"负责"。考虑到这一点,一直在推动Alquist朝这个方向发展。此外,希望Alquist能够利用知识图谱管理对话,并根据先前讨论的话题和实体建议相关信息。

某大学Chirpy Cardinal团队指导教师Christopher D. Manning:这是第一次参加Alexa Prize,团队确实没有做提前准备,所以这完全是一次疯狂的旅程——意思是团队中的每个人都付出了大量工作和压力。但超级令人兴奋的是,基本上能够赶上其他领先团队,他们已经参加比赛好几年了。

评委兼科幻作家Hugh Howey:人工智能是我热衷的兴趣。作为科幻作家,有自由写几乎任何东西,但一直回归的一个主题是思维机器已经对我们生活产生的影响,以及这种影响在未来只会扩大。所以任何有机会参与该领域工作和研究的人对我来说都是不假思索的。像某机构的狗一样抓住了机会。

问:社交机器人的潜力让您感到兴奋的是什么?

Hugh Howey(评委):这项技术将以我们几乎无法理解的方式改变世界。目前,人机界面是一个瓶颈。我们需要很长时间告诉计算机我们想要它们做什么,而且它们通常只做那一次事情,然后忘记学到了什么。未来,越来越多的琐事将被自动化。这将释放人力资本来解决更大的问题。它还将通过消除语言障碍、帮助残疾人使我们团结起来,最终这项技术将可供任何需要的人使用。

某大学指导教师Jinho D. Choi:据报道,美国有超过4400万成年人有心理健康问题,如焦虑或抑郁。相信开发一个能安慰人们的创新社交机器人可以真正帮助那些有心理健康问题的人,他们通常害怕与其他人交谈。可能想知道人工智能如何传达如关怀这样的人类情感。然而,人类使用自己的创作,如艺术和音乐,来安慰自己。愿景是推进AI,人类最伟大的发明,帮助个人更多地了解自己的内心,从而对自己感觉更积极,并在世界上产生更大的影响。

某大学联合团队负责人Ashwin Paranjape:随着社交机器人变得越来越复杂和普及,越来越多的人定期与它们聊天。顾名思义,社交机器人有潜力满足社交需求,如闲聊日常生活,或为与心理健康困难作斗争的人提供支持。此外,社交机器人可能成为我们与世界互动的主要用户界面——例如,聊天新闻,或讨论一本书。

Sarah Fillwock,某大学:这次比赛的经验确实巩固了社交机器人潜力的想法,即为需要支持并处于困境中的人们提供价值。认为社交机器人在全球挑战中最引人注目的角色是提供一个支持性环境,允许人们表达自己,并探索他们对任何正在发生的戏剧性事件的感受。这对弱势群体尤其重要,例如那些没有强大社交圈或与他人社交接触减少的人,阻止他们能够获得被重视和理解的感觉。

问:实现这种潜力的主要挑战是什么?

某大学联合团队负责人Abigail See:目前,社交机器人难以理解冗长、复杂的对话,这限制了它们深入讨论任何话题的能力。为了更好地做到这一点,社交机器人需要理解特定用户想要什么——不仅在讨论话题方面,还包括他们想要进行什么样的对话。另一个重要挑战是允许用户采取更多主动性,自己推动对话。目前,社交机器人倾向于采取更多主动性,以确保对话保持在它们的能力范围内。如果能使社交机器人更加灵活,它们将对人们更有用和更具吸引力。

Sarah Fillwock,某大学:对话系统研究领域面临的一个主要挑战是建立评估对话方法性能的最佳实践。研究社区目前使用多种评估策略来确定新对话方法的性能如何。另一个挑战是对话不仅仅是模式匹配问题。与另一个代理就任何话题进行来回对话往往涉及在对话期间实现特定目标的计划,因为关于对话伙伴的新信息被揭示。对话也很大程度上依赖于拥有一般世界知识的基础,用来充分理解对方言论的含义。

某中心发布Topical Chat数据集。这个基于文本的集合包含超过235,000条语句,将有助于支持对话系统领域高质量、可重复的研究。

Marilyn Walker,某圣克鲁兹大学:开放域对话任务缺乏大型注释对话语料库。例如,自然语言理解的进展得到了大型注释语料库的支持,如Penn Treebank,然而,目前没有这样的公开可用语料库用于开放域对话。此外,丰富的个体用户模型将实现更自然的对话,但隐私问题目前使得构建此类模型变得困难。

Hugh Howey(评委):挑战将是我们的伦理和道德跟上我们的小玩意的步伐。未来我们将更加强大。只希望我们也能更加负责任。

问:COVID-19大流行在您的工作中扮演了什么角色?

某圣克鲁兹大学团队成员Jurik Juraska:疫情爆发对我们的社交机器人最直接的影响当然是,它不能忽视这个新的动态情况。我们的社交机器人必须承认这一新发展,因为那是当时大多数人谈论的内容。因此,会让Athena在对话开始时提出这个话题,同情用户当前的情况,但避免沉溺于负面方面。在一些用户留下的反馈中,有许多表达感谢的话,因为在与朋友和家人的直接社交互动受到极大限制的时候,能够与社交机器人进行有趣的互动。

Kai-Hui Liang,某加州大学:注意到Alexa用户对热门话题的反应方式存在明显差异。例如,在COVID-19之前,许多用户在讨论他们喜欢看的体育比赛、旅行经历或周末计划的活动时给出了引人入胜的回答。COVID-19爆发后,更多用户回复说没有体育比赛可看或无法旅行。因此,调整了话题以更好地适应情况。增加了关于他们在隔离期间的生活经历的讨论(例如,他们的饮食如何改变,或者是否每天外出散步以保持健康)。还观察到更多用户由于隔离可能有负面情绪。例如,一些用户说他们感到孤独,想念朋友或家人。因此,增强了安慰模块,通过积极倾听表达同理心。

Abigail See,某大学:随着疫情的发展,实时看到用户如何改变对我们社交机器人的期望。不仅希望机器人提供最新信息,还希望它对他们所处的情况表现出情感理解。

Sarah Fillwock,某大学:当COVID成为一个重要的社会问题时,尝试了两件事:有一个以体验为导向的COVID话题,机器人在同情和安慰的氛围中与人们讨论他们对COVID的感受;还有一个以事实为导向的COVID话题,提供客观信息。观察到的是,人们对以体验为导向的COVID-19方法的积极反应比以事实为导向的COVID-19方法强烈得多,并且在交谈时似乎更喜欢它。这确实提供了一些经验证据,表明社交代理在动荡时期有很强的潜力通过给人们一个安全和关怀的空间来谈论他们生活中的这些重大事件而有所帮助,因为人们对这种方法做出了积极反应。

问:最后,在自然语言理解、对话管理、对话式AI等领域,有哪些特别的进展让您觉得有前景?

Jan Pichl,某理工大学:看到基于Transformer的模型如今的能力令人兴奋。它们能够生成连贯的大文章甚至整个故事。然而,它们在训练阶段甚至运行时需要大量计算能力。此外,在社交机器人中使用它们仍然具有挑战性,当需要处理不断变化的世界信息时。

Abigail See,某大学:作为自然语言处理研究人员,对该领域令人难以置信的进步速度感到惊讶。自2018年上一届Alexa Prize以来,出现了改变游戏规则的进步,特别是在使用大型预训练语言模型来理解和生成语言方面。Alexa Prize提供了一个独特的机会来应用这些技术,这些技术到目前为止大多只在整洁、明确的任务上进行测试,并将它们放在真实的人面前,包括所有随之而来的混乱!特别兴奋地探索使用神经生成模型与人们聊天的可能性。早在2018年Alexa Prize时,这些模型通常表现不佳,因此没有被任何决赛团队使用。然而,今年,这些系统成为了我们系统的重要支柱。

Sarah Fillwock,某大学:人们一直致力于将常识知识和常识推理纳入对话系统的工作是当前对话式AI领域最有趣的方向之一。使用的许多常识知识没有在任何类型的数据集中明确详细说明,因为人们是通过物理经验或随时间推移的推理学到的,所以目前不一定有任何方便的方法来实现这一目标。已经有很多尝试看看语言建模方法对对话代理能走多远,但即使使用巨大的对话数据集和高度复杂的模型,在常识信息方面仍然成败参半。真的很期待更明确地尝试建模这种常识知识的对话方法和对话资源。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计