在履约中心部署自主机器人的探索
某中心的机器人AI组织开发的技术利用机器学习绘制仓库障碍物地图并实现更流畅的导航。
机器人技术新突破
目前每日有超过50万台机器人在履约中心协助库存管理、订单处理和包裹分拣。这些机器人遵循基于云的算法指令,沿编码标记网格移动。虚拟和物理屏障限制了其与人员的交互范围。
现在,某机构正在测试新一代机器人,它们通过人工智能和计算机视觉技术在履约中心内自由移动。这些机器人可协助工作人员在复杂环境中运输超大尺寸物品——履约中心场地可能覆盖数十个足球场大小,布满人员、托盘和立柱构成的动态迷宫。
“这是首次在自主移动领域应用人工智能技术,“某中心机器人AI总监表示。
语义理解核心技术
这些新机器人的成功关键在于"语义理解"技术:机器人能以区分环境中每个对象的方式理解三维空间结构,并掌握各对象的行为特性。通过实时更新这种理解,机器人可在杂乱动态环境中安全导航。
目前这些机器人在少数履约中心执行特定任务。研究人员正探索如何将这些机器人与现有流程无缝集成,确保每日数百万订单的高效处理。
“技术开发的终极目标是赋能工作人员更安全高效地工作。若不能实现端到端无缝集成,技术将无法被实际使用,“该总监强调。
当前技术挑战
约10%的商品因尺寸或形状特殊无法放入标准货架或传送带。目前工作人员需使用滑轮和叉车在动态环境中运输这些物品。机器人的目标正是接管这类复杂任务。
感知团队负责人正领导新机器人的AI开发。其团队已部署机器人进行自主运输非标品的初步测试。要成功实现该功能,机器人需具备实时环境地图构建能力,区分静态与动态对象,并据此实时决策路径规划和碰撞避免。
“在动态空间中导航只是挑战之一,另一关键是与人类近距离协同工作。这需要首先识别前方是人类并预测其移动轨迹,保持安全距离,“负责人指出。
机器学习实现环境认知
人类通过好奇心和试错学习环境认知,而机器则依靠机器学习。该过程始于基于摄像头和激光雷达数据的语义理解(场景理解)。
“当机器人拍摄环境时,它会获得像素值和深度测量数据。但若没有语义理解,它仅能感知到空间中存在障碍物,“机器学习应用科学家解释道。
语义理解旨在教导机器人定义空间中的点——判断其属于人员、货柜还是立柱,或是地面电缆、叉车或其他机器人。当这些标签与三维视觉表征结合后,机器人可将空间点分类为稳定或移动对象,并据此计算最安全路径。
“导航系统执行语义感知的路径规划。直觉很简单:机器人绕行垃圾桶的方式与避让人员或重要资产的方式必然不同。唯有通过对象识别才能实现这种差异化行为,“总监补充道。
数据训练与预测模型
为教授机器人语义理解,科学家收集了数千张机器人导航时拍摄的图像,由团队逐帧标注对象形状。数据科学家使用这些标注数据训练机器学习模型,实现摄像头视野内对象的分割与标注(即语义分割)。
在语义理解基础上,预测模型教导机器人如何处理检测到的对象。例如检测到立柱时,机器人知其是静态永久物体。团队正在开发新模型以预测人员移动路径并相应调整路线。
“我们的工作既改进静态障碍物的当前表征,也开始建模动态障碍物的近期位置预测。这种表征以机器人可据此规划的方式传递,使其能同时规避静态和动态障碍,“科学家表示。
实际部署与未来展望
目前已有数十台机器人在部分履约中心进行初步测试与优化。这些机器人运输包裹、收集数据,并为科研团队提供性能改进洞见。
“我们已看到未来规模化运营的愿景,成功路径非常清晰,“负责人表示。一旦自主移动机器人车队能成功运输贵重超大物品,相关技术可扩展至其他机器人应用。
“当前聚焦的问题虽具体,但相关能力具有高度通用性,“负责人强调。
人机交互挑战
在履约中心部署自由移动机器人的挑战之一是实现人员接受度。“若机器人快速逼近并在接触前急停,虽符合功能安全标准,但行为模式难以被接受。因此需要生成不仅安全流畅,且具有可读性(人类可理解)的行为,“总监指出。
研究人机交互的科学家正在开发新技术,使机器人能通过非声光方式示意行动意图。模仿学习是其中一种方法:机器人观察人类相互避让的方式并学习模仿该行为。
“接受度挑战是机器人无缝集成到履约中心流程的组成部分。我们正在书写机器人技术的新篇章,这是一个持续演进的过程,“总监总结道,“某中心的独特优势在于能直接接触终端用户。通过内部用户反馈不断优化开发流程,这是技术演进的关键动力。”