AWS AI联盟:模型定制与智能体对决的技术实践

本文详细介绍AWS AI League竞赛中涉及的核心技术,包括使用Amazon Bedrock AgentCore构建智能体、通过SageMaker Studio进行模型微调、以及多智能体架构设计。文章阐述了竞赛的技术流程、评估机制和实战挑战。

AWS AI League: 模型定制与智能体对决

本稿是 2025 年 12 月 23 日于 AWS Machine Learning Blog 发布的 “AWS AI League: Model customization and agentic showdown” 的翻译。 构建能够处理复杂实际任务的智能 AI 智能体并非易事。此外,企业通常不仅需要依赖大规模预训练基础模型,还需要针对自身特定用例,通过微调和小型化、专业化模型进行定制,以实现更高的性能。AWS AI League 通过一场激动人心的竞赛,在智能体 AI 和模型定制领域推动创新,提供创新性计划,帮助企业克服构建高级 AI 能力过程中的挑战。

2025 年,首届 AWS AI League 竞赛吸引了全球开发者、数据科学家和商业领袖的关注。他们使用最新的 AI 工具和技术来解决紧迫的挑战。AWS re:Invent 2025 的决赛是一场激动人心的活动,展示了参赛者的创造力和技能。主要企业的跨部门团队直接对决,展示了创建有效提示、微调模型以及构建强大 AI 智能体的能力。

2025 年 AWS AI League 冠军们,祝贺你们!经过激烈角逐,这三位优秀的构建者胜出,分享了总计 25,000 美元的奖金:

第一名:来自 Cisco 的 Hemanth Vediyera 第二名:来自 Aqfer 的 Ross Williams 第三名:来自 Capital One 的 Deepesh Khanna

本文将介绍如何使用 AWS AI League 计划举办 AI 竞赛。该计划使参与者能够体验模型定制和智能体构建的概念,并将其应用于解决实际的业务挑战,在引人入胜的游戏化形式中展示创新的解决方案。新引入的智能体 AI 和模型定制挑战,使得企业可以利用 AWS 积分举办内部锦标赛,或让开发者在 AWS 活动中竞技。

要开始使用,请访问 AWS AI League 产品页面。

AWS AI League 始于由 AWS 专家主导的 2 小时实践研讨会,随后是自主节奏的实验。这段旅程在激动人心的游戏展示风格的决赛中达到高潮,展示应对紧急业务挑战的 AI 作品和解决方案。下图展示了这三个步骤。

基于 2025 年计划的成功,我们很高兴地宣布 AWS AI League 2026 冠军赛正式启动。今年的竞赛引入了两项全新的挑战,让参与者真正检验其 AI 技能。

  • 智能体 AI 挑战:参赛者使用 Amazon Bedrock AgentCore 构建智能体。选手们创建定制的智能体架构以应对现实世界的商业问题。
  • 模型定制挑战是对智能体 AI 挑战的补充,它使用 SageMaker Studio 中最新的微调配方,针对特定用例定制模型。

2026 AI League 冠军赛的总奖金翻倍至 50,000 美元,并为不同技能水平的开发者(从新手到高级实践者)设置了相应的赛道。

AWS AI League 新增了激动人心的智能体 AI 挑战,参与者使用 Amazon Bedrock AgentCore 构建智能体,并在动态的游戏化竞赛中解决复杂问题。在该挑战中,智能体需要在一个类似迷宫的网格环境中移动,目标是找到宝箱,途中会遇到各种反映真实用例的挑战,例如处理不当内容、执行代码、浏览器操作等,以测试智能体的能力。

智能体有时间限制,必须在此期间内移动地图、收集积分、克服障碍并到达宝箱。获得的积分越多,在排行榜上的排名就越高。参赛者可以使用 Amazon Bedrock AgentCore 的原语完全定制其智能体,从而更安全地扩展和管理生产级智能体。此外,他们可以为监督者或子智能体选择特定模型,或者创建自定义工具(如 Bedrock Guardrails、AgentCore Memory、AWS Lambda 函数)来帮助智能体克服挑战。下图展示了智能体在到达宝箱前必须克服的障碍。

AWS AI League 为用户构建智能体解决方案提供了一个完整的 UI。用户可以使用这个无代码 UI 构建多智能体架构和工具,并集成各种组件,例如用于交互式编码自定义 Lambda 函数和工具的 Amazon SageMaker Studio CodeEditor。这使得用户可以在不离开环境的情况下,在 AWS AI League 网站内完全开发和定制基于智能体的解决方案。

以下截图展示了在 AWS AI League 网站内完成的智能体构建体验。

在竞赛期间,用户会收到关于其智能体表现的实时反馈。由 LLM 驱动的评估系统提供客观评价,帮助迭代改进。下图展示了挑战期间智能体是如何被评估的。

在决赛中,顶尖的决赛选手登上舞台,以现场游戏秀的形式展示其智能体的能力。这证明了智能体 AI 在解决复杂多步问题方面的强大力量和多功能性。评估标准包括时间效率、挑战解决准确性、智能体的规划能力以及令牌消耗效率。以下快照展示了 re:Invent 2025 决赛最后一轮的情况。

AWS AI League 的模型定制挑战扩大了范围,使参与者能够利用最新的微调技术。 用户可以在 Amazon SageMaker Studio 内访问新的模型定制体验,并使用强大的新训练配方。目标是开发出高度有效且领域专精的模型,使其性能超越更大规模的参考模型。 挑战从磨练模型定制技能开始。参赛者运用学到的工具和技术,应用高级微调方法来提升模型性能。模型定制完成后,真正的考验才开始。定制好的模型被提交到排行榜上,与参考模型进行性能比较。每当自动评估系统判定您的定制模型的回答比参考模型的输出更准确、更全面时,您就能获得积分。展示高级技能,攀登排行榜榜首,为您所在的组织开辟新的可能性。 在挑战期间,提交到排行榜后,您将从自动评估系统收到关于模型性能的实时反馈。排行榜在整个竞赛期间持续评估提交物在参考数据集上的表现,提供关于准确性的即时反馈,从而帮助迭代改进解决方案。下图展示了如何使用 AI 评估来评估定制模型。

在决赛中,顶尖决赛选手将以现场游戏秀的形式演示其模型能力,并展示提示工程技能。游戏秀中,领域专家和现场观众参与实时投票,专家评审(判断哪个 AI 解决方案能最好地解决实际业务挑战)的分数将被计入总得分。下图展示了决赛期间参与者的提示工程界面。

本文介绍了新的 AWS AI League 挑战,以及它如何改变组织的 AI 开发方式。在 AWS,我们了解到竞争是促进创新的最有效方式。AWS AI League 让开发者能够展示、竞争并释放他们的 AI 技能。 要了解如何在您的组织中举办 AWS AI League,请访问 AWS AI League。此外,要更深入地学习构建智能体或定制 AI 模型,请利用 AWS Skill Builder 中的 AWS AI 培训目录。

Marc Karp 是 Amazon SageMaker Service 团队的 ML 架构师。他专注于帮助客户设计、部署和管理大规模的 ML 工作负载。业余时间,他喜欢旅行和探索新地方。

Natasya K. Idries 是 AWS AI/ML 游戏化学习计划的产品营销经理。她热衷于通过引人入胜、注重实践的教育计划弥合先进技术与实用业务实施之间的差距,从而普及 AI/ML 技能。她在构建学习社区和推动数字创新方面的专业知识继续塑造着她创建有影响力的 AI 教育计划的方法。工作之余,Natasya 喜欢旅行、烹饪东南亚美食和探索自然步道。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计