自监督学习在足球检测及其他领域的应用:专访RoboCup 2025最佳论文奖得主
获奖研究背景
在RoboCup 2025研讨会上获得最佳论文奖的研究聚焦于自主足球机器人的关键技术——精准的足球检测。该研究由Can Lin、Daniele Affinita、Marco Zimmatore、Daniele Nardi、Domenico Bloisi和Vincenzo Suriani共同完成。
技术挑战与解决方案
核心问题
深度学习通常需要大量标注数据,这对于RoboCup等特定任务构成了挑战。研究团队需要自行收集和标注数据,这一过程既不可扩展又需要大量人力。
自监督学习框架
研究采用自监督学习方法,通过以下方式学习数据的有用表示:
- 使用 pretext 任务(如图像随机掩码补全)让模型从数据中学习有意义的特征
- 结合原始图像和来自大型教师模型的外部指导
- 利用在通用任务上预训练的YOLO模型提供边界框指导,帮助自监督学习聚焦特定任务
技术实现细节
- 目标:预测足球周围的紧密圆形
- 方法:使用预测松散边界框的预训练模型作为外部指导
- 优势:矩形边界框比圆形更具通用性
实际应用效果
RoboCup 2025部署成果
- 相比2024年基准模型有明显改进
- 最终训练所需数据量大幅减少
- 在不同光照条件下表现出更强的鲁棒性
- 解决了以往模型对特定场景过度适配的问题
技术迁移与应用拓展
农业领域应用
- 将球体检测器应用于精准农业中的圆形水果检测
- 参与CANOPIES项目,专注于永久作物的精准农业
- 开展葡萄检测和收获项目
代码复用愿景
- 建立源自RoboCup代码的单一软件平台
- 人形机器人可复用相同的稳定化、视觉核心和框架代码
- 通过模块更换实现完全不同的应用场景
团队发展与未来规划
技术路线演进
- 关注人形机器人新世代发展
- 参与2025年8月北京世界人形机器人游戏大赛
- 考虑加入新合并的联赛或转向成人尺寸机器人
研究重点
- 保持多智能体协调研究的传统优势
- 平衡硬件平台选择与研究目标
- 适应RoboCup联赛结构调整
技术展望
为实现2050年挑战目标,需要将各联赛整合,汇聚策略、硬件和协调等各个研究方面,形成统一的竞赛平台。