Janus框架推动持续学习技术新突破

本文介绍某机构研发的Janus持续学习框架,该框架通过自动化异常检测、数据标注和模型重训练流程,使机器人能够自适应处理不断变化的包裹类型,实现了计算机视觉与强化学习的深度融合,为机器人系统提供可扩展的持续学习解决方案。

Janus框架推动持续学习技术新突破

在某机构物流中心,Robin机械臂需要处理形状、尺寸和颜色各异的包裹(包括盒子、圆柱体和缓冲邮件袋)。每个批次的包裹都不同,机器视觉系统必须通过将包裹分割成独立元素来理解这些变化。

虽然人类能本能完成这种任务,但Robin机械臂需要经过数月训练才能区分不同包裹类型。科学家最初采用监督学习训练Robin,通过数万张图像评估视觉系统分割包裹堆的准确性。当准确率达标后,机械臂被部署到物流中心。但挑战在于:包裹特征处于持续变化中。

持续学习的核心挑战

机器学习模型需要适应不断变化的数据环境。某机构作为全球性企业,运输的包裹类型和分布频繁变化,模型必须在保持高性能的同时适应这些变化。为此,研究团队开发了名为Janus的新型学习框架。

Janus以罗马过渡之神命名,通过自动化重训练流程的多个环节,为Robin机械臂提供强大的重训练框架。该系统主要解决两类异常:

  1. 环境异常:如灯光故障或相机失焦,易于识别和修复
  2. 信息异常:包括新包裹类型、节日图案包装或透明包装的新玩具,这些是需要学习建模的新数据

自动化训练流程

当检测到异常事件后,持续学习团队会对新图像进行标注,包括位置、边界、形状和分类标签。获得足够标注图像后,系统开始用新数据重训练模型。

为提高训练效率,系统采用数据增强技术:对原始图像进行缩放、翻转、旋转、明暗调整、变色、模糊化及图像组合等处理,大幅增加训练样本量。

为确保新数据不影响现有模型准确性,重训练模型需通过历史数据测试,验证性能保持或提升后,再进入现场测试阶段。测试通过专用工作站进行,研究人员构建测试包裹堆验证机器人处理能力,通过后再在物流中心进行小规模测试。

Janus的技术实现

Janus框架自动化管理异常事件捕获、分类、图像标注、训练集创建和模型训练全过程。系统自动监测机器人遇到的新事件,并通过算法指标识别模型置信度问题。

当出现杂乱场景时,Robin模型会将场景分割为独立包裹(每个盒子、缓冲邮件袋等都被单独标记并标注边界)。如果拾取失败、掉落包裹或错拿包裹,系统通过分析场景分割结果定位问题。

Janus自动识别需要标注的问题包裹,并通过标注数据排序最可能引发挑战的包裹类型。这些实时计算任务依赖云计算服务按需调用资源,最大限度减少计算开销。

向强化学习演进

研究团队计划将Janus从代码库转型为集成服务,使任何用户都能直接部署到机器人中。未来Janus可能集成强化学习技术,让模型自主探索解决方案并找到最佳结果。

强化学习与监督学习显著不同之处在于感知与行动的紧密耦合。机器人的行动可用于生成最佳结果,例如人类可能会移动包裹堆来拾取单个包裹,而强化学习可能帮助机器人获得这种能力而不降低作业速度。

技术扩展前景

Robin的图像解析能力已经非常优秀,研究团队希望将这些能力扩展到其他机器人。通过预训练跨环境、跨任务和跨背景的大数据集模型,然后使用新环境的少量数据进行微调,可以用相对较少的数据实现高分割性能。Janus这类持续学习框架使得通用模型能够规模化训练,跨越不同任务和环境。


comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计