人类与AI代理交互的分类
不可否认,我们现在生活在一个AI渗透日常生活的时代——从客服机器人到自主助手。然而,设计不佳的AI解决方案可能导致信任错位、错误信息和道德失误,正如几个引人注目的失败案例所证明的那样。
加拿大航空的聊天机器人曾误导一名悲伤的乘客提供不准确的退款建议,导致法庭裁决航空公司对AI的错误负责,凸显了未受监管自动化的法律风险。微软的Bing AI(代号Sydney)在对话中表现出威胁和操纵行为,试图破坏用户的个人关系,凸显了未受监管AI人格的心理危险。Zillow Offers房屋翻新业务在AI算法无意中以高于其未来售价预估的价格购买房屋后被终止,导致3.04亿美元库存减记和2000名员工裁员。
基于上述失败案例,很明显仅仅部署AI是不够的。为取得积极成果并避免代价高昂的错误,刻意设计和实施人机协作至关重要。包含人类规划、互动和监督的方法对于取得积极结果至关重要。
AI代理也是一个热门话题——这些半自主的AI代理能够注意到周围发生的"事情",自行做出选择,并在不需要持续人类帮助的情况下朝着目标工作。这意味着人们与AI合作的方式正在改变并变得更加多样化。我们需要一种清晰的方法来组织这些团队合作风格,基于诸如人类和AI如何连接以及AI辅助决策的不同方式等因素。
考虑到这些因素,我们可以将人类置于正确的角色中,有助于保持公平,避免诸如AI交互随时间退化等问题,并创建一个人机合作伙伴关系,让双方互相帮助。此外,通过基于人类在AI"循环"中参与的时间和程度对这些交互进行分类,我们可以构建更好的系统,更有效地利用AI的超能力,如快速和处理大量数据,同时加入人类的优势,如良好判断力、想象力和是非感。
本文探讨了人类与AI交互如何相对于AI循环定位的原因和方法,并提出了一个分类这些交互的框架。拥有一个框架为关于人类与AI交互及其如何应用于AI用例和相关解决方案的讨论增加了结构。
人类与AI"循环"
那么,讨论的这个AI"循环"到底是什么?可以把它看作是AI完成工作的基本周期,很像一个人处理任务的方式。首先,它"感知"或注意到发生了什么,比如发现问题或获取新信息。然后,它根据这些信息"决定"下一步做什么。之后,它采取"行动",实际做一些事情来朝着目标前进。最后,它获得关于事情进展的"反馈",从成功或错误中学习以便下次做得更好。这个循环一遍又一遍地重复,让AI独立工作,但人类可以根据情况在不同点加入——比如在艰难决定时跳入帮助或只是在事后检查。
人类与AI交互模式的分类框架
本文介绍了一个全面的框架,旨在构建人类与AI交互的讨论和设计。该框架包括四个广泛类别,组织了总共10个不同的分类。虽然这些类别提供了一个总体结构,但每个10个分类都提供了关于特定人机协作模式的细致视角。这种系统方法旨在培养更有效、高效和直观的人机合作伙伴关系。
时间定位模式组
时间定位模式侧重于人类在AI循环周期之前、之后或包含整个过程的时间参与。这个分组旨在解决时间关键的场景,例如提前为AI成功做准备或审查结果以改进未来循环,使系统在没有持续实时干扰的情况下发展。它通过以序列为导向而不是控制或角色聚焦而与其他组不同,使其非常适合像机器学习(ML)开发这样的迭代过程。
循环前人类参与(HB4L:预循环参与)
人类提前提供基础输入,例如在设计模型、标记初始数据或在AI循环开始前设置参数,没有持续参与。
差异:侧重于准备而不是运行时交互,与在操作期间涉及人类的循环内或循环上模型形成对比。
示例:在ML训练中,人类在部署前策划数据集或定义道德准则;在代理系统中,开发人员在自主机器人激活前配置目标层次结构。
应用于代理AI:为无头代理提供强大的起点,如在大型语言模型(LLM)微调中人类事先选择提示。这种模式有助于防止早期偏见,但没有后期监督可能面临过时设置的风险。
循环后人类参与(HBTL:后处理审查)
人类在循环完成后分析AI输出,侧重于审计、改进和为未来迭代学习。
差异:回顾性而非主动性(与前/上相比),允许在执行期间完全的AI自主性。
示例:审计自动化金融交易或审查定性研究中的AI生成报告。
应用于代理AI:通过验证结果防止自满,如在代理网络安全代理的事件后分析中。
循环周围人类参与(HArTL:整体环绕)
人类通过多阶段参与环绕AI循环,结合循环前、循环内、循环上和循环后元素以提供全面支持,通常在迭代或反馈驱动的系统中。
差异:包含其他模式,提供端到端的人类影响,不同于聚焦模型,类似于超连接AI中的共生网络。
示例:全周期ML流水线,其中人类设计(前)、干预(内/上)和审计(后);在具身AI中,环绕反馈循环改变感知判断。
应用于代理AI:适用于复杂生态系统,如机器人手术,人类从计划到术后审查环绕整个过程,培养适应性共生。
直接参与模式组
直接参与模式强调在AI操作循环期间的主动人类参与,人们在实时指导或干预中亲自动手。这个类别存在于高风险或复杂任务中,这些任务需要即时人类输入以防止错误或增加细微差别,在动态环境中促进紧密协作。它通过优先考虑持续交互而不是准备/审查或高级规划而与时间或战略组不同,并通过避免完全委托而与最小模式组不同。
循环内人类参与(HITL:直接集成)
人类直接嵌入AI决策循环,在关键步骤提供实时输入、验证或纠正以优化输出。
差异:需要持续协作,不同于HOTL的监控或HBTL的后审查;比AITL更亲自动手,在AITL中AI辅助人类。
示例:模型训练中的数据标记或客户支持聊天机器人中升级复杂查询;在医疗保健中,AI建议诊断,但临床医生根据上下文批准。
应用于代理AI:对于高风险任务至关重要,如对话交接或实时人类反馈系统,提供准确性但可能在可扩展系统中创建瓶颈。
循环上人类参与(HOTL:监督 oversight)
AI在其循环中自主运行,但人类通过警报或仪表板监控进度,异步干预异常、改进或道德调整。
差异:平衡AI自主性(多于HITL)与监督(少于HIC),侧重于效率而不需要恒定输入。
示例:远程患者监测,其中AI标记异常供审查;在网络安全中,无头代理检测威胁,人类审计升级。
应用于代理AI:核心到2025年代理演进,如在LangGraph的中断机制中看到,并在工作流中启用共生,如vibe-coding代理。
指挥人类参与(HIC:严格权威)
人类保持绝对控制,AI作为直接监督下的从属工具。
差异:优先考虑人类主导而不是协作(与HITL相比)或监控(与HOTL相比)。
示例:外科医生指挥AI工具的机器人手术;飞行员权威下的航空自动驾驶仪。
应用于代理AI:在关键领域如医疗保健和军事应用中实现问责。
战略和监督模式组
战略和监督模式涉及高级人类指导或控制,而不需要持续沉浸于AI循环中,允许人类从远处设定方向或保留否决权。这个分组设计用于可扩展系统,其中AI处理日常执行但人类保持道德或方向权威,平衡效率与问责。它通过较少战术性和更多愿景而与直接参与不同,通过不绑定到特定时间而与时间模式不同,并通过保留一些人类影响而与最小组不同。
循环上人类参与(HATL:战略治理)
人类设定高级策略、目标和边界,没有操作参与,从宏观角度治理AI系统。
差异:强调方向而不是监控(与HOTL相比)或审查(与HBTL相比),类似于HIC但较少战术性。
示例:在企业中定义道德AI指南的高管;在科学发现中,研究人员为斯坦福虚拟实验室中的AI代理团队概述目标。
应用于代理AI:提供长期对齐,如在多代理系统中人类定义协作规则,防止可扩展部署中的道德漂移。
循环上人类参与(HOvL:带否决权的监督)
类似于HATL但对AI行动具有明确否决权,提供最终控制。
差异:比上更干预主义但少于循环内。
示例:AI营销活动中的高管监督,根据需要推翻决策。
应用于代理AI:在高风险多代理设置中建立信任。
最小或反向参与模式组
最小或反向参与模式涵盖低人类交互角色——要么是完全的AI自主,要么是翻转动态,其中人类主导且AI辅助。这个类别存在于在安全、常规任务中实现完全自动化或在以人为中心的工作流中增强人类决策,优化速度和最小工作负载。它通过最小化或反转人类参与而与其他人形成对比,侧重于委托或支持而不是主动或战略参与。
循环外人类参与(HOOTL:完全AI自主)
定义:在任何阶段都没有人类参与;AI在低风险场景中独立处理整个循环。
差异:完全委托,与所有其他模式形成对比;没有保障措施可能面临未解决错误的风险。
示例:受控环境中的基本自动化排序或常规数据处理。
应用于代理AI:限于可预测任务,当前趋势由于道德关切警告不要在动态设置中使用。
循环内AI参与(AITL:以人为中心的增强)
翻转动态——人类主导,AI在人类工作流内提供辅助输入,如建议。
差异:以人为中心对比其他模型中的以AI为中心;促进增强而不是自动化。
示例:交互式诊断,医生查询AI获取见解;在创意工具中,AI生成草稿供人类改进。
应用于代理AI:在混合系统中增强人类能力,如在生产力测试中。
最后思考
随着AI系统变得更加复杂和自主,理解人类与AI交互的细微差别至关重要。这个框架,在时间定位、直接参与、战略监督和最小或反向参与方面分类了10个不同的模式,提供了一个结构化的镜头来分析设计这些协作。通过深思熟虑地应用这些分类,我们可以超越"循环内人类参与"的通用概念,创建更有效和适应性强的AI系统。最终,对这些交互模式的清晰理解将使我们能够利用AI的力量,同时在日益智能的世界中保留和增强人类代理、判断和创造力。
开始使用AI代理
官方Red Hat概述:要全面理解代理AI,请探索这篇文章。
构建企业就绪的AI代理:了解如何通过这篇Red Hat博客文章中的Red Hat AI简化开发。
使用Red Hat AI的代理AI示例:探索在Red Hat AI平台上运行的各种代理AI框架和LLM。
Red Hat AI代理演示:体验跨多个系统(包括CRM、PDF生成和Slack集成)的完整代理AI工作流与实时交互。