AI智能体将成功因为一器胜十器
AI智能体能够聊天、使用工具和编写新代码,所有这些都通过一个界面完成。这就是它们能够持久存在的原因。
图片来源:Alexandra Francis
在LLM的潘多拉魔盒被打开三年后,公司们不再谈论聊天机器人。相反,我收到的每个播客推介都提到AI智能体。这确实是新的热点,但技术创造者看到了构建下一代计算机科学基础关注点的巨大机会:抽象和自动化。
智能体解决的部分问题是我们在这个博客上讨论了一段时间的问题:上下文切换。开发者喜欢良好的心流状态,但大量的工具、通知、红点和闪烁的应用会分散我们的注意力,将我们从正在做的工作中拉走。AI行业是否是即将破裂的泡沫尚不得知,但无论是否破裂,我认为AI智能体作为思考AI(以及一般知识/技术工作)的方式将会持久存在。
在AI热潮早期,Isaac Lyman写了一个非常犀利的观点,自此指导了我的很多思考:AI不是应用程序,而是用户界面。AI智能体更进一步:它们是使用工作流程中每个软件的自然语言界面。它们能够聊天、使用工具和编写新代码,所有这些都通过一个界面完成。而这个单一界面——你整个生产生活的单一入口点——将是智能体持久存在的原因。
一统天下的单一界面
计算机用户界面从旧的MS-DOS和基于Unix系统的纯文本终端,发展到仅与特定软件和功能交互的高度优化和配置的图形界面。大型语言模型(LLM)将我们带回到那个纯文本界面,只是这次你不需要了解神秘和深奥的强大词汇来充分利用环境(向所有Vim囚徒致敬)。你可以直接用母语说话或打字并获得响应,不需要秘密知识(尽管提示工程师可能不同意)。
AI智能体将那种语言作为界面并添加工具使用。虽然已经存在跨应用程序API和变通方案一段时间了,但随着当前推动智能体使用API并在现有软件周围构建模型上下文协议(MCP)服务器的努力,这种访问正在标准化。现在,AI中的竞争空间不是基础模型;而是智能体编排器。带有工具使用的自然语言意味着可能存在一个进入你整个工具、技术和SaaS产品套件的单一入口点。
在现代软件企业中,开发者可以访问大量工具,但他们不一定知道如何有效使用它们。考虑现代技术栈中的所有基础设施、CI/CD、测试、开源依赖、安全、可观测性、数据管理等工具。开发者每周可能浪费多达四个小时在这些工具之间切换。如果你正在构建生成式AI功能,那又是另一堆复杂且新的工具。IBM watsonx.ai产品负责人Maryam Ashoori进行了一项调查,发现开发者仅构建GenAI系统就使用五到十五个工具。“他们中的大多数人表示,他们无法花费超过两个小时学习一个新工具,“她总结道。
保持对所有那些工具的专业知识(更不用说知道它们存在)可能占用大量脑力空间。当你处理一个问题时——比如如何构建软件系统或功能——你可能不理解该功能触及的工具和技术的广度。“如果你在一家大公司工作,可能有几十个甚至数百个系统,“Salesforce开发者关系高级副总裁Christophe Coenraets说。“智能体为你提供那个对话界面,你可以简单地说出你想做什么。智能体会弄清楚如何正确完成。”
这并不是说你可以跳过所有信息安全(infosec)和DevOps审查,或者凭感觉编码绕过架构文档。你仍然需要规划系统并让所有利益相关者审查它,但智能体的首次通过可以识别所有可能在此过程中被微调的小部分。你可以专注于系统设计,让你的小机器人实习生阅读所有开源软件(OSS)依赖的文档。
你可以看到这将如何使停留在单一窗口中变得容易。许多开发者无论如何都生活在他们的终端或IDE中,因此提供一种自动化方式使用自然语言访问该终端外的软件,将使这些开发者更深入地嵌入他们最喜欢的终端或IDE(“我不是囚徒,我是自愿住在Vim中的!")。
终端,作为一个允许工具使用的文本界面,可能成为未来开发者的单一界面。“终端已经是一个存在长时间运行任务概念的地方,“智能体终端应用Warp的创始人兼首席执行官Zach Lloyd说。“它已经允许多任务处理。智能体未来的许多基本要素已经存在于终端中,如果那是人们的最终归宿,那将是一个疯狂的全周期事情。我不知道这是否会发生,但有很多因素支持它,并且我们的用户现在正从终端中的这些智能体功能中获得很多价值。”
当然,并非每个应用程序(甚至不是每个开发者应用程序)都可以使用纯自然语言运行。很有可能在神奇的智能体未来,我们仍然需要用户界面,以便我们可以调整旋钮并指向图表。有些人指出《星际迷航》是想象这个系统的先驱:主要是语音界面,带有用于专门任务的图形。但所有这些都可以作为从你最喜欢的单一应用程序实例化的对话框存在,就像现在的配置或高级设置一样。
当我们让智能体用生成的代码构建更多功能、界面和智能体时,事情变得有点奇怪。想象一个适应你的用例和需求的自定义UI,你需要的任何功能都可以通过提示实时添加。Google对此有一个研究演示,虽然当前的实现有些粗糙,但可能性是巨大且未知的。“这是最后一个技术时期,因为其他一切都将由AI开发,“原始"Attention Is All You Need"Transformer论文的合著者、NEAR的联合创始人Illia Polosukhin说。
你的平台工程团队刚刚变得更加重要
好吧,让我们踩刹车。这里有很多内容有点过于乐观和技术乐观主义。为了让这个运行一队出色的小智能体完成你讨厌的所有枯燥工作的单一界面的勇敢新世界成为现实,有人将不得不做大量工作来构建它们。我们未来 selves 将拥有的所有这些纺金的智能体将需要大量编程、测试和基础设施。
平台工程团队在过去十年左右已成为工程组织中更突出的部分。它们从管理生产代码的DevOps团队发展而来。随着生产中的代码越来越意味着在云原生环境中运行的微服务,人们开始将DevOps视为产品,构建使运行日益分布式代码更容易的功能。最终,这膨胀到开发者体验领域,允许开发者只编写业务逻辑,而不必担心基础设施、互连性以及故障预防和管理。
“我们提供基础设施本身、配置基础设施的方式、与基础设施交互的方式,以及很多关于你实际开发代码时的事情,“CLEAR的高级工程经理Caitlin Weaver说。“所以不仅仅是你的代码去向哪里,还包括里面有什么以及与之合作的过程。我们可以安全地提供很多抽象,安全地隐藏很多细节,以降低开发者的复杂度水平。”
对于生产软件,这意味着共享依赖、基础设施和流量的编排、指标和可观测性、安全、部署等。在自有基础设施上运行或作为付费SaaS产品运行的工具上内部运行的智能体将需要其中大部分,但也带来额外问题。你可能希望运行一套模型以进行成本效益和评估目的——这需要路由基础设施。你需要代码来实现护栏和提示与响应的治理。你需要一个框架,以正确的结构化调用和适当的身份验证将工具调用路由到正确的地方。你可能甚至需要启动几个MCP服务器。
这个智能体基础设施服务于与生产基础设施相同的目的:开发者只需要思考如何实现智能体逻辑。大多数平台工程工作旨在使系统更DRY(不要重复自己):每个人在生产中都必须执行这些操作,但你不希望每个人重复工作。“我们不希望开发者每次构建智能体时都重新发明轮子,“Kong的首席技术官Marco Palladino说。“有很多横切需求是每个智能体都需要具备的。平台团队——现在球在他们场地上。提出一个平台,可以帮助所有这些开发者构建默认安全、可观测、可治理等的智能体。”
人们将用智能体做的很多事情涉及数据——通常是专有且对业务敏感的。让我们面对它:很多应用程序只是花哨的CRUD界面,因此很多常见的智能体关注点将围绕数据访问和管理。智能体擅长数据处理——比如,分析过去三个月的流量日志——因此你的智能体系统需要安全地连接到数据源,并将其输送到可以使用它的应用程序。这需要相当多的规划才能做好。“我如何连接正确的数据?“Snowflake产品总监Jeff Hollan问。“我如何清理数据?我如何使数据可呈现?所有那些数据科学家、数据工程师和数据分析师正在做的任务,我们能否帮助他们在