3个问题与Marzia Polito:使用小样本学习规模化执行计算机视觉任务
Polito是6月2日首届虚拟某中心网络服务机器学习峰会的特邀演讲者之一。
问:您在机器学习峰会上演讲的主题是什么?
将讨论如何支持某中心网络服务客户(包括那些没有机器学习专业知识的客户)开发高质量的计算机视觉模型,用于通用工具无法解决的视觉任务。在许多情况下,通常用于训练机器学习模型的标注训练数据稀缺。
可以通过使用迁移学习来规避训练数据不足的问题。迁移学习利用了跨领域共享的模式。人类一直在使用迁移学习。例如,我们不需要观察数千只知更鸟就能识别新的知更鸟。只需要观察几只,就能建立与红胸脯的关联。通过将知更鸟的观察结果与先前对鸟类的知识相结合来传递知识。
在计算机视觉领域,迁移学习可以在专业领域发挥重要作用。继续以知更鸟为例,如果你是鸟类学家,你会希望计算机视觉模型观察知更鸟的图像并立即识别相关亚种。甚至希望它能够识别一个新物种,即使以前没有人遇到过该物种。这正是客户对AI系统的最终期望。
如今,通过使用"小样本学习"技术实现这一目标,该技术能够执行定制的视觉任务(如图像分类),只需少量或稀有标签,并借助少量所需结果的样本即可。
问:为什么这个话题在当今科学界特别相关?
过去几年,深度学习使科学家取得了以前难以想象的成果。社区蓬勃发展,成熟度足以使科学真正对世界有用。如今,科学家们正在利用计算机视觉推动自动驾驶导航系统、医学影像分析、考古学和建筑等领域的进步。
然而,仍有大量未解决的问题为推进科学提供了真正机遇。数据丰富,标签不足。需要识别的物体、人物、地点、场景和动作的格局日益复杂,人们没有时间或资源为其添加标签。通过思考这些现实用例,被迫在严格约束下操作,并协调复杂的解决方案,而不仅仅是训练简单模型。
小样本图像分类和目标检测正是所说的很好例子。直到最近,我们才开始关注从非常有限的图像集中训练计算机视觉模型。毕竟,我们生活在一个共享视频和图像数量呈指数级增长的世界中。
然而,视频和图像的爆炸式增长意味着我们没有时间或资源为所有这些数据添加标签。对于医学或考古学等专业领域尤其如此,从业者没有带宽或资源为图像添加标签,或开发深度神经网络来孤立地解决每个任务。
为了在如此多约束的世界中运作,迫切需要推进元学习、转导学习和半监督学习等领域的尖端技术。为图像分类或目标检测等传统计算机视觉问题开辟了新的设置和约束领域。好消息是这些问题非常真实,解决它们时的回报也是如此。
问:能否提供一些某中心网络服务客户如何使用小样本学习来扩展和自动化任务的例子?
所有某中心网络服务自定义标签和视觉检测客户都受益于迁移学习。自定义标签用于识别特定于业务需求的图像和对象。视觉检测客户利用该服务发现视觉表示中的缺陷和异常。
对于使用这些服务的每家企业,首先确定最合适的模型和技术。这确保了任何预先存在的知识得到最充分利用。已经开发并发布了涵盖执行该选择的有效方法的研究。
如今,媒体企业正在使用小样本学习技术分析数百万帧并检索特定角色。医疗公司正在诊断影像中使用这些技术。电力公司通过使用计算机视觉识别并关闭有缺陷的设备来预防野火。这些企业及更多企业正在使用小样本学习来解决这些问题,一旦解决,将为世界各地的人们带来益处。