约翰霍普金斯与某机构宣布首批研究资助获得者
某机构与约翰霍普金斯大学今日宣布了首批博士研究生奖学金和教师研究资助获得者,这是JHU + 某机构交互式人工智能计划(AI2AI)的一部分。该计划于4月启动,设立于约翰霍普金斯大学怀廷工程学院,旨在推动人工智能领域的突破性进展,重点关注机器学习、计算机视觉、自然语言理解和语音处理。
“我们对约翰霍普金斯大学教师和学生提交的高质量研究提案和博士奖学金提名感到欣喜,“某中心Alexa AI副总裁表示,“毫无疑问,这一倡议将推动交互式和多模态人工智能技术实现新的进步。”
作为该计划的一部分,年度某中心奖学金将授予怀廷工程学院的博士研究生。某机构还资助由约翰霍普金斯大学教师主导的研究项目,这些项目与博士后研究人员、本科生和研究生以及研究 staff 合作。今年的获奖者是该计划的首批获得者。
“我们的学生和教师有机会在某机构合作,在交互式AI这一重要领域开展合作,我们感到非常兴奋,“约翰霍普金斯大学怀廷工程学院研究与合作副院长表示,“利用我们在这一领域的集体专业知识将推动人工智能发展,并为社会带来诸多益处。”
以下是获奖研究生及其研究方向的列表,随后是教师资助获得者及其研究项目。
某中心研究生奖学金获得者
Kelly Marchisio 正在攻读计算机科学博士学位,师从计算机科学教授: “词嵌入空间是现代自然语言处理系统的关键组成部分。我的工作重点是理解和利用嵌入空间几何,目标是创建更小、更有用、跨语言和领域更普遍适用的空间。”
Arya McCarthy 正在攻读计算机科学博士学位,师从计算机科学教授: “我将我的自然语言处理愿景称为千语言处理:不仅要对数千种语言进行建模,还要让它们的集体证据和共性相互加强。为了实现这一目标,我创建了神经机器翻译模型;形态学词元化器、标注器和变形器;甚至进行了跨越数千种语言的颜色术语分析,旨在推动这些前沿领域的发展。这一愿景是由说话者的需求现实以及当前自然语言处理未能满足这些需求所驱动的。”
Carolina Pacheco Oñate 正在攻读生物医学工程博士学位,师从某机构学者兼生物医学工程教授: “我感兴趣的是在数据和注释有限的领域推进计算机视觉,这不仅与传统的计算机视觉任务中的长尾事件相关,也与其他具有社会影响力的领域如生物医学科学相关。我相信将深度学习与概率模型和领域知识相结合可以在容量和结构之间提供适当的平衡,从而在自监督和弱监督机制中实现从有限数据中学习。”
Desh Raj 正在攻读计算机科学博士学位,师从电气和计算机工程副教授: “自从30多年前第一个自动语音识别系统建成以来,语音技术的进步使得诸如自动客户支持和语言学习等应用成为可能。通过多年对语音增强和鲁棒语音处理的研究,这些系统现在已部署在家庭扬声器和车辆控制等多样化环境中。然而,这些现有系统是被动听众,转录单说话者的话语并馈送到下游语言理解组件。未来的对话智能预计将包含能够积极参与人类对话的系统。”
Anshul Shah 正在攻读计算机科学博士学位,师从电气和计算机工程及生物医学工程特聘教授: “我目前的研究广泛涉及基于姿态的动作识别、视频理解、自监督学习和多模态学习。我的研究试图对这些研究领域做出基础性贡献,获得新的见解并推动技术发展。我的兴趣与AI2AI在交互式AI技术领域的重点密切相关,特别是在计算机视觉和多模态AI领域。”
Jeya Maria Jose Valanarasu 正在攻读电气和计算机工程博士学位,师从电气和计算机工程副教授: “用于计算机视觉的深度学习方法在视觉识别领域取得了显著进展。其成功的一个主要原因是这些模型训练的数据量。为每个新问题或应用注释新的真实标签非常低效。此外,当前的视觉系统在训练期间未见过的数据分布上表现不佳。这个问题被称为领域适应,对于在实时部署模型非常重要。”
教师研究资助获得者
Mark Dredze,计算机科学副教授: “将大型语言模型的知识表示与信息提取系统集成” “过去几年,捕捉语言模式的新型AI模型在从语言中学习信息方面变得非常擅长。这个项目探索如何利用这些模型学习的信息来为语言数据的实际应用提供信息,例如识别产品评论中产品的重要特征或特性。”
Philipp Koehn,计算机科学教授,和Kenton Murray,人类语言技术中心研究科学家: “评估多语言机器翻译的多语言性” “深度神经网络在人工智能中的普及使得研究人员和工程师能够构建可以在大型语言组之间自动翻译的系统,而无需构建单独的模型。然而,拥有一个大型通用模型的局限性尚未得到充分理解。我们旨在研究这类AI模型的前沿领域。”
Anqi Liu,计算机科学助理教授: “通过分布鲁棒学习实现在线领域适应” “这个项目旨在通过建模不确定性实现AI算法的快速和鲁棒适应。这个资助使我能够研究具有现实世界影响潜力的基础研究问题。”
Jesus Antonio Villalba López,电气和计算机工程助理研究教授: “通用语音处理模型” “这个项目将研究如何利用大规模AI模型有效提取语音中包含的信息。结果将是一个能够将语音转录为文本,并确定说话者身份、语言和情绪状态等的通用模型。”
Soledad Villar,应用数学与统计助理教授: “绿色AI:通过利用对称性实现强大且轻量级的机器学习” “在这个项目中,我们研究在机器学习模型设计中使用对称性和低维结构。强制执行这些数学结构将使我们能够减少训练和评估机器学习模型所需的能源消耗、时间和数据量,同时保持(甚至提高)其性能。”
Laureano Moro-Velazquez,语言与语音处理中心助理研究教授: “改进非典型语音人群的语音理解” “在这个项目中,我们将创建一个新的数据集并开发新的语音技术,旨在改善非典型语音和语音障碍患者的生活。几乎没有包含非典型语音的公开数据集,而这些对于为受影响人群创建新的辅助技术是必要的。”
Mahsa Yarmohammadi,语言与语音处理中心助理研究科学家: “通过自动投影和人工监督快速创建多语言数据集” “人工智能,特别是自然语言处理,需要大规模数据来学习强大的模型。这样的数据可能在英语等高资源语言以外的语言中不可用。在这个项目中,我们研究通过将一种语言的可用数据集自动翻译和对齐到多种其他语言来快速创建多语言数据集。”
Alan Yuille,认知科学与计算机科学特聘教授: “用于少样本学习的弱监督多模态变换器及其在新领域和细粒度任务中的泛化” “自监督和弱监督变换器已被证明对各种视觉、语言和视觉-语言任务非常有效。这个提案针对三个挑战。首先,提高标准任务的性能,特别是在细粒度任务上。其次,开发分词器方法以实现少样本,理想情况下零样本学习。第三,调整这些方法,使其能够泛化到新领域和分布外情况。”