Janus框架推动持续学习技术革新

在某中心物流仓库的传送带旁，Robin机械臂正在处理不断移动的包裹。这些包裹包含不同形状、尺寸和颜色的箱子、圆柱体及缓冲邮件袋。每个批次的包裹都各不相同，Robin的计算机视觉系统必须通过将场景分割为独立元素来理解这些变化。

虽然人类儿童能本能完成这种区分，但Robin机械臂需要经过数月的训练才能识别不同包裹类型。科学家最初通过监督学习训练Robin，利用数万张图像评估视觉系统分割包裹堆的准确性。当系统准确率达到部署标准后，新的挑战随之出现：包裹形态始终处于动态变化中。

“机器学习模型必须适应持续变化的数据环境，“某机构机器人应用科学家指出，“作为全球性企业，运输包裹的类型和分布频繁变化。模型需要在保持高性能的同时适应这些变化，这需要持续学习技术的支持。”

为此研究团队开发了名为Janus的新学习框架。该框架以罗马过渡之神命名，通过自动化部分重训练流程，为Robin机械臂提供强大的重训练框架，标志着向持续学习平台开发迈出重要一步。

复杂的技术挑战

持续学习的概念看似简单：当Robin遇到意外包装时（其准确率通常超过99%），通过持续学习进行自适应。但实际挑战远更为复杂。

首要障碍是确定哪些异常事件需要重训练。异常事件分为两类：环境异常（如灯光故障或相机失焦）和信息异常（如新包装类型、节日图案或透明包装产品）。后者是模型需要学习的新数据类型。

当识别新型数据后，持续学习团队会对图像进行标注，包括包裹位置、边界、形状和分类。积累足够标注图像后，即可用新数据重训练模型，维持甚至提升Robin识别新旧包裹的能力。

高效训练需要多样化样本。“获得优质原始图像后，我们会进行增强处理，“Janus团队软件开发经理解释，“包括缩放、翻转、旋转、明暗调整、变色、模糊化及图像拼接。每个图像可衍生出多个版本，提供模型训练所需的大量数据。”

为确保新数据不降低现有模型准确性，会在历史数据上测试重训练模型，验证机器是否保持或提升性能水平。通过测试的模型将进入现场测试阶段，首先在专用测试站进行原型测试，随后在物流中心的一两条产线进行beta测试，最终通过验证后才会大规模部署。

自动化流程管理

同时捕获新事件、根据复发频率分类、标注图像、创建训练集和执行模型训练需要大量管理工作——Janus的设计目标正是自动化这些流程。

Janus自动监测机器人遇到新事件的情况。“人类遇到不确定情况时会告知原因，但机器人无法说明问题所在。因此需要使用其他指标来识别模型何时及为何缺乏置信度，“科学家解释道，“当处理杂乱场景时，Robin的模型会将场景分割为独立包裹。如果拾取失败、掉落包裹或错拿包裹，可通过分析模型分割场景的方式识别问题。”

Janus自动识别需要标注的问题包裹，这些标注有助于识别和排序最可能造成挑战的包裹类型。实时执行这些任务计算强度大，随着Robin机器人数量增长，持续学习依赖某机构云服务按需调用云端功能来最小化计算开销。

“我们利用云服务组件构建计算机学习的’装配线’，“经理表示，“同时采用新型图像检测器识别目标和环境的显著变化。当满足条件时，会触发批处理作业对原始图像采样并保存以备重训练。”

强化学习集成

持续学习团队的最终目标是将Janus从代码库集合转变为集成服务，任何用户都可直接部署到机器人中。“获得模型后，系统将自动寻找异常，挑选最常见的新事件并从中学习，“机器学习工程师表示。

Janus还可能演进集成强化学习。“在强化学习中，模型需要自主探索可能性并找到合适解决方案，“经理说明，“这与监督学习显著不同，因为感知与行动之间存在更紧密的耦合。机器人的行动可用于生成最佳结果。例如人类可能会移动包裹堆来拾取单个包裹，如何让机器人获得这种能力而不降低产线速度？强化学习可能提供实现途径。”

Robin的图像解析能力已经非常出色，研究团队现在希望将这些能力扩展到其他机器人。“我们希望创建通用模型，用更少的训练数据分割包裹，“科学家解释，“通过在不同环境、任务和背景下收集的大数据集预训练模型，然后用新环境的少量数据微调模型。只需相对较少的数据即可获得高分割性能。Janus这样的持续学习框架使我们能够扩展通用模型，跨越多任务和环境进行训练。”