Janus框架推动持续学习技术革新

本文介绍某机构研发的Janus持续学习框架,该框架通过自动化模型重训练流程、处理数据分布变化、整合增强学习等技术,显著提升机器人适应动态环境的能力,为工业机器人系统提供可扩展的解决方案。

Janus框架推动持续学习技术革新

在某中心物流仓库的传送带旁,Robin机械臂正在处理不断移动的包裹。这些包裹包含不同形状、尺寸和颜色的箱子、圆柱体及缓冲邮件袋。每个批次的包裹都各不相同,Robin的计算机视觉系统必须通过将场景分割为独立元素来理解这些变化。

虽然人类儿童能本能完成这种区分,但Robin机械臂需要经过数月的训练才能识别不同包裹类型。科学家最初通过监督学习训练Robin,利用数万张图像评估视觉系统分割包裹堆的准确性。当系统准确率达到部署标准后,新的挑战随之出现:包裹形态始终处于动态变化中。

“机器学习模型必须适应持续变化的数据环境,“某机构机器人应用科学家指出,“作为全球性企业,运输包裹的类型和分布频繁变化。模型需要在保持高性能的同时适应这些变化,这需要持续学习技术的支持。”

为此研究团队开发了名为Janus的新学习框架。该框架以罗马过渡之神命名,通过自动化部分重训练流程,为Robin机械臂提供强大的重训练框架,标志着向持续学习平台开发迈出重要一步。

复杂的技术挑战

持续学习的概念看似简单:当Robin遇到意外包装时(其准确率通常超过99%),通过持续学习进行自适应。但实际挑战远更为复杂。

首要障碍是确定哪些异常事件需要重训练。异常事件分为两类:环境异常(如灯光故障或相机失焦)和信息异常(如新包装类型、节日图案或透明包装产品)。后者是模型需要学习的新数据类型。

当识别新型数据后,持续学习团队会对图像进行标注,包括包裹位置、边界、形状和分类。积累足够标注图像后,即可用新数据重训练模型,维持甚至提升Robin识别新旧包裹的能力。

高效训练需要多样化样本。“获得优质原始图像后,我们会进行增强处理,“Janus团队软件开发经理解释,“包括缩放、翻转、旋转、明暗调整、变色、模糊化及图像拼接。每个图像可衍生出多个版本,提供模型训练所需的大量数据。”

为确保新数据不降低现有模型准确性,会在历史数据上测试重训练模型,验证机器是否保持或提升性能水平。通过测试的模型将进入现场测试阶段,首先在专用测试站进行原型测试,随后在物流中心的一两条产线进行beta测试,最终通过验证后才会大规模部署。

自动化流程管理

同时捕获新事件、根据复发频率分类、标注图像、创建训练集和执行模型训练需要大量管理工作——Janus的设计目标正是自动化这些流程。

Janus自动监测机器人遇到新事件的情况。“人类遇到不确定情况时会告知原因,但机器人无法说明问题所在。因此需要使用其他指标来识别模型何时及为何缺乏置信度,“科学家解释道,“当处理杂乱场景时,Robin的模型会将场景分割为独立包裹。如果拾取失败、掉落包裹或错拿包裹,可通过分析模型分割场景的方式识别问题。”

Janus自动识别需要标注的问题包裹,这些标注有助于识别和排序最可能造成挑战的包裹类型。实时执行这些任务计算强度大,随着Robin机器人数量增长,持续学习依赖某机构云服务按需调用云端功能来最小化计算开销。

“我们利用云服务组件构建计算机学习的’装配线’,“经理表示,“同时采用新型图像检测器识别目标和环境的显著变化。当满足条件时,会触发批处理作业对原始图像采样并保存以备重训练。”

强化学习集成

持续学习团队的最终目标是将Janus从代码库集合转变为集成服务,任何用户都可直接部署到机器人中。“获得模型后,系统将自动寻找异常,挑选最常见的新事件并从中学习,“机器学习工程师表示。

Janus还可能演进集成强化学习。“在强化学习中,模型需要自主探索可能性并找到合适解决方案,“经理说明,“这与监督学习显著不同,因为感知与行动之间存在更紧密的耦合。机器人的行动可用于生成最佳结果。例如人类可能会移动包裹堆来拾取单个包裹,如何让机器人获得这种能力而不降低产线速度?强化学习可能提供实现途径。”

Robin的图像解析能力已经非常出色,研究团队现在希望将这些能力扩展到其他机器人。“我们希望创建通用模型,用更少的训练数据分割包裹,“科学家解释,“通过在不同环境、任务和背景下收集的大数据集预训练模型,然后用新环境的少量数据微调模型。只需相对较少的数据即可获得高分割性能。Janus这样的持续学习框架使我们能够扩展通用模型,跨越多任务和环境进行训练。”

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计