AI语音解决方案正在通过实现客户与AI代理之间的自然对话来改变呼叫中心,缩短等待时间,大幅降低运营成本,同时不牺牲客户期望的类人交互体验。随着某中心Nova Sonic在某中心Bedrock的近期发布,现在可以构建通过语音自然交流的复杂对话AI代理,无需单独的语音识别和文本转语音组件。Amazon Nova Sonic是某中心Bedrock中的语音到语音模型,支持实时、类人的语音对话。
虽然许多早期的Amazon Nova Sonic实现侧重于本地开发,但该解决方案提供了完整的云端部署架构,可作为构建实际概念验证应用程序的基础。该资源可通过某中心云开发工具包(AWS CDK)部署,并为使用预配置基础设施组件构建更多Amazon Nova用例提供基础,同时允许自定义架构以满足特定业务需求。
本文展示如何为名为AnyTelco的虚构公司创建AI驱动的呼叫中心代理。该代理名为Telly,可以处理客户关于套餐和服务的查询,同时使用通过模型上下文协议(MCP)框架实现的自定义工具访问实时客户数据。
解决方案概述
该系统由以下层级组成:
前端层 - 前端层构建时考虑了可扩展性和性能:
- 某中心CloudFront分发充当Web应用程序的内容分发网络
- 某中心简单存储服务(Amazon S3)托管静态资产
- UI处理音频流和用户交互
通信层 - 通信层促进无缝的实时交互:
- 网络负载均衡器管理WebSocket连接。WebSocket在用户浏览器和服务器之间实现双向交互通信会话,这对实时音频流应用至关重要
- 某中心Cognito提供用户身份验证和JSON Web令牌(JWT)验证
处理层 - 处理层构成系统的计算骨干:
- 某中心弹性容器服务(Amazon ECS)运行容器化后端服务
- 某中心Fargate提供无服务器计算后端
- Python后端处理音频流并管理Amazon Nova Sonic交互
智能层 - 智能层使用AI和数据技术为核心功能提供支持:
- 某中心Bedrock中的Amazon Nova Sonic模型处理语音处理
- 某中心DynamoDB存储客户信息
- 某中心Bedrock知识库将基础模型(FM)与组织的数据源连接,允许AI应用程序引用特定于业务的准确、最新信息
先决条件
开始之前,请确保具备:
- Python 3.12
- Node.js v20
- npm v10.8
- 某中心账户
- 已设置AWS CDK
- 在某中心Bedrock中启用Amazon Nova Sonic
- Chrome或Safari浏览器环境
- 可用的麦克风和扬声器
部署解决方案
使用以下终端命令开始部署:
|
|
部署创建两个某中心CloudFormation堆栈:网络堆栈和应用程序资源堆栈。第二个堆栈的输出提供CloudFront分发链接,导向登录页面。
自定义应用程序
该解决方案的关键特性是其灵活性—可以根据特定用例定制AI代理的功能。示例实现通过自定义工具和知识集成展示了这种可扩展性:
客户信息查询 - 使用电话号码作为键从DynamoDB检索客户档案数据 知识库搜索 - 查询某中心Bedrock知识库以获取公司信息、套餐详情和定价
这些功能展示了如何通过外部数据源和领域特定知识增强Amazon Nova Sonic的功能。
清理
使用以下命令移除堆栈:
|
|
结论
AI代理正在改变组织处理客户服务的方式,提供同时处理多个对话、全天候提供一致服务、即时扩展同时保持质量和降低运营成本的能力。该解决方案通过提供在某中心上部署Amazon Nova Sonic应用程序的基础,使这些好处变得可访问。
通过将Amazon Nova Sonic模型与强大的云架构、安全身份验证和灵活的工具集成相结合,组织可以快速从概念转向概念验证。该解决方案不仅帮助构建语音AI应用程序,还帮助各行业公司提高客户满意度和生产力。