某中心如何构建AI智库平台

面对市场上众多开源和专有大语言模型（LLM），企业如何选择适合的模型仍是一个关键决策。模型选择直接影响组织的扩展性、性能和合规性。

因此，选择LLM远不止评估基准分数，还需要全面评估模型与业务目标的一致性、与现有技术基础设施的集成度，以及是否符合监管和合规标准。

一些领先的企业级LLM包括某机构的GPT系列（GPT-4o、GPT-4.5、GPT-3.5企业版）、某中心的Gemini 2.0 Pro和Gemini for Workspace、某机构的Claude 3系列（Opus、Sonnet和Haiku），以及某机构的Llama 3和即将推出的Llama 4。

然而，在企业中扩展生成式AI不仅仅需要选择一个高性能模型。组织必须仔细比较每个模型的优势、独特功能和定价结构，同时权衡安全、数据隐私、操作控制以及与现有系统集成的便捷性等关键因素。

“我们的问题是如何扩展这项（ChatGPT）技术，让团队成员安全地进行实验，并快速构建能够通过使用该技术推动业务价值的应用程序，”某中心数据工程副总裁在DES 2025上表示。

这一讨论促成了某中心GenAI平台Think Tank的创建。某中心的一小支工程师团队在数据中心托管了开源模型Llama，并构建了一个简单的聊天应用程序。一旦证明了其真正的业务价值，重点就转向扩展该解决方案。

学习扩展

某中心Gen AI平台的基础是模型花园。它旨在提供对多种LLM和SLM的受控访问，包括云中托管的专有模型和某中心自有GPU堆栈上运行的开源模型。该副总裁指出，这使团队能够灵活选择最适合其用例的模型。

某中心认识到LLM需要上下文才能生成有意义的输出，因此开发了基础服务。这些服务允许团队在响应中注入、管理和指导上下文数据的使用。

为了确保跨用例的一致性品牌声音，引入了提示服务，通过语气和品牌元数据丰富提示，并优化令牌使用——帮助进行提示压缩和令牌优化以管理成本。

鉴于生成式AI的相关风险，如幻觉、偏见或安全威胁，建立了审核和评估服务，以清除有害内容、屏蔽个人身份信息（PII），并确保安全、符合政策的响应，与网络安全和负责任AI团队密切合作。

由于许多用例是实时且面向客户的，某中心提到还内置了性能管理工具，为租户提供可观察性，以根据需要跟踪、优化和限制使用。

成本是一个主要考虑因素，配额管理服务提供了每次LLM交互成本的详细可见性。该副总裁补充说，他们“为开发人员、产品经理和业务领导者提供可见性”。

此外，为了促进创新文化，某中心推出了Think Tank AI Studio，这是一个安全的实验空间，每月提供10美元的令牌配额。该空间使开发人员、产品经理和业务用户能够测试想法、快速验证并扩展最有影响力的想法，确保整个组织的“无畏实验”。

某中心的AI购物助手

基于Think Tank构建的首批用例之一是某中心网站上的AI购物助手，它帮助客户做出明智的产品选择。

“最初，我们只有模型花园。我们尝试了各种LLM以找到最相关的响应，但产品数据有限，”该副总裁表示。

某中心的团队很快意识到，提高AI助手相关性和准确性的关键在于基础服务。他们的基础服务整合了来自产品属性、常见问题解答和客户评论的结构化数据。“这提高了助手的上下文意识，”该副总裁说，并补充说这使其能够提供更符合客户期望的响应。

随着开发的进展，路由挑战浮现，特别是当用户提出“我的订单在哪里？”等问题时。最初，助手无法处理此类查询。为了解决这个问题，团队实施了意图分类，允许系统将问题路由到正确的内部服务。

该副总裁进一步提到，这实际上是代理抽象的早期迹象，标志着平台逐渐向更自主、以目标为导向的功能演进。

审核也成为一个关键焦点领域，特别是用于管理不适当或离题的提示。这种方法不仅保护了品牌，还通过减少不必要的LLM调用来降低成本。

由于这是某中心首个面向客户的生成式AI用例，风险状况 deliberately 严格。公司的评估服务使用真实客户查询和人在环采样的组合来评估助手的响应。

该副总裁透露，这一迭代开发过程最有价值的成果之一是创建了模型基准测试能力。平台获得了基于性能和适合度比较多个LLM的能力，为每个用例动态选择性能最佳的模型打开了大门。

其他企业的做法

与此同时，某家具公司推出了名为Muse的新AI工具，帮助客户可视化家具在特定环境中的外观。某家具公司使用某云上的Gemini自动分类其3000万产品目录中的产品，将策划新列表和更新现有列表的时间减少了67%。

某家具公司CTO在接受采访时表示：“公司目前正在试验几种LLM，包括某机构、某中心和某机构的模型。Gemini在目录丰富方面表现更好，ChatGPT在客户响应方面更有效，而Claude在编码任务中更受青睐。”

2022年，某家居公司推出了某创意工具，帮助客户在任何设备上以3D方式设计和可视化他们的房间。

去年十月，某零售巨头也分享了其使用AI、AR和沉浸式技术的计划。这包括某AI模型集，旨在改善客户与其平台的互动。同时，某电商巨头推出了自己的AI购物助手某鲁弗斯。