阿里通义千问模型正式登陆Amazon Bedrock,开启全托管AI开发新篇章

阿里通义千问Qwen3系列模型现已在Amazon Bedrock平台全面上线,包含混合专家与稠密架构的四种模型,支持代码生成、智能体工作流构建等场景,提供从32B到480B参数规模的灵活选择,助力开发者快速构建AI应用。

Qwen模型现已在Amazon Bedrock上线 | AWS新闻博客

今天,我们在Amazon Bedrock中新增了来自阿里巴巴的Qwen模型。通过此次发布,Amazon Bedrock通过以全托管、无服务器方式提供Qwen3开放权重基础模型(FMs),持续扩展模型选择范围。本次发布包含四个模型:Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507和Qwen3-32B(稠密架构)。这些模型同时具备混合专家(MoE)和稠密架构,为不同的应用需求提供灵活选择。

Amazon Bedrock通过统一API提供行业领先的基础模型,无需基础设施管理。您可以访问来自多个模型提供商的模型,将模型集成到应用程序中,并根据工作负载需求扩展使用。通过Amazon Bedrock,客户数据永远不会用于训练底层模型。随着Qwen3模型的加入,Amazon Bedrock为以下用例提供了更多选择:

  • 通过扩展上下文理解进行代码生成和仓库分析
  • 构建编排多个工具和API的智能体工作流以实现业务自动化
  • 使用混合思维模式进行自适应推理,平衡AI成本与性能

Amazon Bedrock中的Qwen3模型

这四个Qwen3模型现已在Amazon Bedrock中提供,每个模型都针对不同的性能和成本需求进行了优化:

  • Qwen3-Coder-480B-A35B-Instruct - 这是一个混合专家(MoE)模型,总参数480B,激活参数35B。它针对编码和智能体任务进行了优化,在智能体编码、浏览器使用和工具使用等基准测试中表现出色。这些能力使其适用于仓库级代码分析和多步骤工作流自动化。

  • Qwen3-Coder-30B-A3B-Instruct - 这是一个MoE模型,总参数30B,激活参数3B。专门针对编码任务和指令跟随场景进行了优化,该模型在多种编程语言的代码生成、分析和调试方面表现出强大性能。

  • Qwen3-235B-A22B-Instruct-2507 - 这是一个指令调优的MoE模型,总参数235B,激活参数22B。它在编码、数学和通用推理任务中提供有竞争力的性能,在能力与效率之间取得平衡。

  • Qwen3-32B(稠密架构) - 这是一个具有32B参数的稠密模型。它适用于实时或资源受限的环境,如移动设备和边缘计算部署,其中一致性能至关重要。

Qwen3的架构和功能特性

Qwen3模型引入了若干架构和功能特性:

MoE与稠密架构对比 - 如Qwen3-Coder-480B-A35B、Qwen3-Coder-30B-A3B-Instruct和Qwen3-235B-A22B-Instruct-2507等MoE模型,每个请求仅激活部分参数,提供高性能且推理高效。稠密模型Qwen3-32B激活所有参数,提供更一致和可预测的性能。

智能体能力 - Qwen3模型可以在一次模型调用中处理多步推理和结构化规划。当集成到智能体框架中时,它们可以生成调用外部工具或API的输出。这些模型还能在长会话中保持扩展上下文。此外,它们支持工具调用,允许与外部环境进行标准化通信。

混合思维模式 - Qwen3引入了混合问题解决方法,支持两种模式:思考模式和非思考模式。思考模式在提供最终答案前应用逐步推理,这适用于需要深入思考的复杂问题。而非思考模式为复杂度较低、速度比深度更重要的任务提供快速、近乎即时的响应。这有助于开发者更有效地管理性能与成本之间的权衡。

长上下文处理 - Qwen3-Coder模型支持扩展上下文窗口,原生支持高达256K令牌,通过外推方法可达100万令牌。这使得模型能够在单个任务中处理整个代码仓库、大型技术文档或长对话历史。

何时使用每个模型

这四个Qwen3模型服务于不同的用例。Qwen3-Coder-480B-A35B-Instruct专为复杂软件工程场景设计,适用于高级代码生成、长上下文处理(如仓库级分析)以及与外部工具的集成。Qwen3-Coder-30B-A3B-Instruct特别适用于代码补全、重构和回答编程相关查询等任务。如果您需要在多个领域中获得多功能性能,Qwen3-235B-A22B-Instruct-2507提供了平衡,在利用其MoE架构效率优势的同时,提供强大的通用推理和指令跟随能力。Qwen3-32B(稠密架构)适用于一致性能、低延迟和成本优化至关重要的场景。

在Amazon Bedrock中开始使用Qwen模型

要开始使用Qwen模型,在Amazon Bedrock控制台中,我可以使用导航窗格的Chat/Text Playground部分,通过几个提示快速测试新的Qwen模型。

要将Qwen3模型集成到我的应用程序中,我可以使用任何AWS SDK。AWS SDK包含对Amazon Bedrock InvokeModel和Converse API的访问。我还可以将这些模型与任何支持Amazon Bedrock的智能体框架一起使用,并使用Amazon Bedrock AgentCore部署智能体。例如,以下是使用Strands Agents构建的具有工具访问权限的简单智能体的Python代码:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
from strands import Agent
from strands_tools import calculator

agent = Agent(
    model="qwen.qwen3-coder-480b-a35b-v1:0",
    tools=[calculator]
)

agent("Tell me the square root of 42 ^ 9")

with open("function.py", 'r') as f:
    my_function_code = f.read()

agent(f"Help me optimize this Python function for better performance:\n\n{my_function_code}")

现已提供

Qwen模型今天在以下AWS区域可用:

  • Qwen3-Coder-480B-A35B-Instruct在美国西部(俄勒冈)、亚太地区(孟买、东京)和欧洲(伦敦、斯德哥尔摩)区域提供。
  • Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507和Qwen3-32B在美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、亚太地区(孟买、东京)、欧洲(爱尔兰、伦敦、米兰、斯德哥尔摩)和南美洲(圣保罗)区域提供。

请查看完整区域列表以获取未来更新。您可以立即开始测试和构建,无需基础设施设置或容量规划。要了解更多信息,请访问Amazon Bedrock中的Qwen产品页面和Amazon Bedrock定价页面。

立即在Amazon Bedrock控制台上试用Qwen模型,并通过AWS re:Post for Amazon Bedrock或您常用的AWS支持渠道提供反馈。

— Danilo

2025年9月18日更新 - 移除了模型访问部分。Amazon Bedrock将通过自动为每个AWS账户启用所有无服务器基础模型和任何新模型,简化访问流程,无需通过Bedrock控制台手动激活访问。模型访问页面将于2025年10月8日停用。账户管理员通过AWS IAM策略和服务控制策略(SCPs)保留对模型访问的完全控制权,以根据需要限制模型访问。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计