Qwen模型正式登陆Amazon Bedrock:开启高效AI开发新篇章

阿里云Qwen系列大模型现已正式入驻Amazon Bedrock平台,包含四种不同架构的模型,支持代码生成、智能体工作流构建等场景,为开发者提供更丰富的AI模型选择和无服务器部署方案。

Qwen模型现已在Amazon Bedrock中可用

今天,我们将阿里云的Qwen模型添加到Amazon Bedrock中。通过此次发布,Amazon Bedrock通过以全托管、无服务器的方式提供Qwen3开放权重基础模型(FMs),继续扩展模型选择范围。本次发布包括四个模型:Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507和Qwen3-32B(Dense)。这些模型同时具备专家混合(MoE)和密集架构,为不同的应用需求提供灵活选择。

Amazon Bedrock通过统一API提供行业领先的基础模型访问,无需基础设施管理。您可以访问来自多个模型提供商的模型,将模型集成到应用程序中,并根据工作负载需求扩展使用。通过Amazon Bedrock,客户数据永远不会用于训练底层模型。随着Qwen3模型的加入,Amazon Bedrock为以下用例提供了更多选择:

  • 通过扩展上下文理解进行代码生成和代码库分析
  • 构建编排多个工具和API以实现业务自动化的智能体工作流
  • 使用混合思维模式进行自适应推理,平衡AI成本和性能

Amazon Bedrock中的Qwen3模型

这四个Qwen3模型现已在Amazon Bedrock中可用,每个模型都针对不同的性能和成本要求进行了优化:

  • Qwen3-Coder-480B-A35B-Instruct - 这是一个专家混合(MoE)模型,总参数量为480B,激活参数量为35B。它针对编码和智能体任务进行了优化,并在智能体编码、浏览器使用和工具使用等基准测试中取得了强劲结果。这些能力使其适用于代码库级别的代码分析和多步骤工作流自动化。
  • Qwen3-Coder-30B-A3B-Instruct - 这是一个MoE模型,总参数量为30B,激活参数量为3B。该模型专门针对编码任务和指令遵循场景进行了优化,在多种编程语言中的代码生成、分析和调试方面表现出色。
  • Qwen3-235B-A22B-Instruct-2507 - 这是一个经过指令调优的MoE模型,总参数量为235B,激活参数量为22B。它在编码、数学和通用推理任务中提供有竞争力的性能,在能力和效率之间取得平衡。
  • Qwen3-32B(Dense) - 这是一个密集模型,参数量为32B。它适用于实时或资源受限的环境,如移动设备和边缘计算部署,这些环境对一致性性能要求很高。

Qwen3的架构和功能特性

Qwen3模型引入了若干架构和功能特性:

MoE与密集架构对比 - MoE模型(如Qwen3-Coder-480B-A35B、Qwen3-Coder-30B-A3B-Instruct和Qwen3-235B-A22B-Instruct-2507)对每个请求仅激活部分参数,提供高性能且推理高效。密集模型Qwen3-32B则激活所有参数,提供更一致和可预测的性能。

智能体能力 - Qwen3模型可以在一次模型调用中处理多步推理和结构化规划。当集成到智能体框架中时,它们可以生成调用外部工具或API的输出。这些模型还能在长会话中保持扩展上下文。此外,它们支持工具调用,以实现与外部环境的标准化通信。

混合思维模式 - Qwen3引入了混合问题解决方法,支持两种模式:思考模式和非思考模式。思考模式在提供最终答案之前应用逐步推理,这非常适合需要深入思考的复杂问题。而非思考模式则为不太复杂、速度比深度更重要的任务提供快速、近乎即时的响应。这有助于开发者更有效地管理性能和成本之间的权衡。

长上下文处理 - Qwen3-Coder模型支持扩展的上下文窗口,原生支持高达256K tokens,通过外推方法可支持高达100万tokens。这使得模型能够在单个任务中处理整个代码库、大型技术文档或长对话历史。

何时使用每个模型

这四个Qwen3模型服务于不同的用例。Qwen3-Coder-480B-A35B-Instruct专为复杂的软件工程场景设计,适用于高级代码生成、长上下文处理(如代码库级别分析)以及与外部工具的集成。Qwen3-Coder-30B-A3B-Instruct对于代码补全、重构和回答编程相关查询等任务特别有效。如果您需要在多个领域中获得通用性能,Qwen3-235B-A22B-Instruct-2507提供了一个平衡的选择,在提供强大的通用推理和指令遵循能力的同时,利用其MoE架构的效率优势。Qwen3-32B(Dense)适用于对一致性性能、低延迟和成本优化很重要的场景。

在Amazon Bedrock中开始使用Qwen模型

要开始使用Qwen模型,我可以在Amazon Bedrock控制台的导航窗格中使用Chat/Text Playground部分,通过几个提示快速测试新的Qwen模型。

要将Qwen3模型集成到我的应用程序中,我可以使用任何AWS SDK。AWS SDK包含对Amazon Bedrock InvokeModel和Converse API的访问。我还可以将这些模型与任何支持Amazon Bedrock的智能体框架一起使用,并使用Amazon Bedrock AgentCore部署智能体。例如,以下是使用Strands Agents构建的具有工具访问权限的简单智能体的Python代码:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
from strands import Agent
from strands_tools import calculator

agent = Agent(
    model="qwen.qwen3-coder-480b-a35b-v1:0",
    tools=[calculator]
)

agent("Tell me the square root of 42 ^ 9")

with open("function.py", 'r') as f:
    my_function_code = f.read()

agent(f"Help me optimize this Python function for better performance:\n\n{my_function_code}")

现已可用

Qwen模型今天在以下AWS区域可用:

  • Qwen3-Coder-480B-A35B-Instruct在美国西部(俄勒冈)、亚太地区(孟买、东京)和欧洲(伦敦、斯德哥尔摩)区域可用。
  • Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507和Qwen3-32B在美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、亚太地区(孟买、东京)、欧洲(爱尔兰、伦敦、米兰、斯德哥尔摩)和南美洲(圣保罗)区域可用。

请查看完整的区域列表以获取未来更新。您可以立即开始测试和构建,无需基础设施设置或容量规划。要了解更多信息,请访问Amazon Bedrock中的Qwen产品页面和Amazon Bedrock定价页面。

立即在Amazon Bedrock控制台上试用Qwen模型,并通过AWS re:Post for Amazon Bedrock或您常用的AWS支持渠道提供反馈。

— Danilo

2025年9月18日更新 — 移除了模型访问部分。Amazon Bedrock将通过自动为每个AWS账户启用所有无服务器基础模型以及任何新模型,来简化访问流程,无需再通过Bedrock控制台手动激活访问。模型访问页面将于2025年10月8日停用。账户管理员通过AWS IAM策略和服务控制策略(SCP)保留对模型访问的完全控制权,以根据需要限制模型访问。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计