OpenAI提示工程六大原则:构建更智能的AI交互指南

本文详细解析OpenAI构建小时会议中提出的六大提示工程原则,包括避免冲突指令、调整推理力度、结构化提示设计等实用技巧,帮助用户更高效地与GPT-5等大语言模型协作。

提示工程六大原则:来自OpenAI构建小时的经验总结

每月,OpenAI都会举办“构建小时”活动,团队成员与社区分享关于不断发展的生成式AI世界的见解。本月会议聚焦于提示工程,随着ChatGPT-5的发布,我们希望重点介绍他们的指导原则,帮助大家充分利用这个新工具版本。

在TCDI,我们理解精准沟通的价值,无论是在诉讼中起草论点、在电子取证中管理海量数据集、确保合规审查的准确性,还是为生成式AI系统构建正确的问题框架。本次构建小时活动中,专家们分享了提示工程的指导原则。这些不是严格的规则,而是实用的起点,能帮助我们在与所有大语言模型(不仅是ChatGPT-5)协作时获得更好结果。

TCDI的技术实验室与协作中心致力于探索新技术及其在法律行业的应用。我期待实践这些提示原则,压力测试它们如何应用于现实世界的法律、合规和技术工作流程。技术实验室是我们专门用于试点新兴技术的环境,我们可以在将其扩展到客户合作之前进行测试、优化和分享最佳实践。

以下是我对这些原则的理解、它们的重要性以及在实践中的应用示例。

1. 避免冲突指令

早期ChatGPT模型在接收到不精确或矛盾指令时经常会“揣测言外之意”。而GPT-5会按字面意思解读指令。如果你的指导存在两个方向上的冲突,模型不会自动调和,而是会反映这种冲突,削弱结果质量。

示例:

  • 不佳示例: 写一份简洁的一页摘要,尽可能包含更多细节。
  • 良好示例: 写一份一页摘要,突出三个主题,每个主题包含2-3个支持细节。

需要更清晰指令的信号:

  • 多次迭代的响应感觉不一致
  • 模型满足你请求的一部分但忽略其他部分
  • 你需要花费额外时间编辑以修复矛盾

2. 使用适当的推理力度

将“推理力度”视为GPT-5投入任务的脑力程度。更高的力度会给出更深入、更谨慎的答案,但可能耗时更长、成本更高。较低的力度更快、更便宜,但可能更表面化。目标是匹配任务所需的力度,避免浪费时间或遗漏重要细节。

力度级别示例:

  • 低力度: 快速回忆或格式化
    • 列出五个美国州名
    • 将这些要点转换为单句标题
    • 从本段提取日期和参与方
  • 中等力度: 平衡分析
    • 将这份5页的案件摘要总结为一段
  • 高力度: 复杂规划和综合
    • 设计自动化合同审查计划,包括分阶段推出和风险分析

需要调整力度的信号:

  • 如果模型遗漏步骤、忽略约束或过度简化,应增加提示中提供的力度
  • 如果结果感觉臃肿、过度解释或对于当前任务过慢,应减少提示中给出的细节

3. 有意构建提示结构

格式化不是表面功夫,而是认知过程。你构建提示的方式告诉模型如何组织其推理。松散、非结构化的提示会产生松散、非结构化的答案(垃圾进,垃圾出)。明确的格式化给GPT-5提供了遵循的地图。

我们发现这在输出用于案件时间线、特权日志或质量控制工作流程等任务时最为重要。结构化提示减少返工,提高一致性,并使下游自动化成为可能。

示例提示 - 证言摘要:

  • 总结附带的证言笔录
  • 长度:500-1000词
  • 重点:关键证人承认事项
  • 约束:为“关键承认”提供要点(每点一条)和证言流程的叙述性摘要

需要更多结构的信号:

  • 不同迭代间的输出差异很大
  • 模型忽略长度或重点等约束
  • 你在使用结果前需要花费额外时间重新格式化

4. 尝试元提示

本质上,元提示是使用大语言模型开发或优化提示,以获得更好、更一致的结果。因此,在要求GPT-5修复输出之前,先请它简要诊断错误发生的原因。然后使用该诊断来驱动有针对性的提示修订。在精益六西格玛中,这是DMAIC的“分析”阶段,在跳转到实施解决方案之前识别问题的根本原因。

为何有效:

  • 揭示隐藏假设。例如,优先考虑责任而非损害赔偿
  • 通过解决根本原因而非仅解决症状来防止修补式修复
  • 产生更一致、可解释的改进,这对可辩护性文件至关重要

何时使用元提示:

  • 在同一约束(长度、重点、引用风格)上重复出错
  • 幻觉或过度自信的摘要
  • 当输出馈入时间线或质量控制等工作流程时出现格式化漂移

三步循环:

  • 诊断(简短、具体): 要求用40词或更少说明原因
  • 修订: 重述约束并仅请求更正信息
  • 验证: 让模型使用通过/失败清单审核其输出是否符合约束

响应示例:

  • 问题: 证言摘要忽略了损害赔偿
  • 诊断: 我强调了责任,因为提示首先突出了它。没有明确指示讨论损害赔偿。假设损害赔偿细节超出范围
  • 修订: 在保持字数限制的同时添加损害赔偿子部分
  • 验证: 清单确认责任和损害赔偿都得到处理

5. 为规划和自我反思留出空间

当GPT-5不必直接提供答案时,它表现最佳。通过给它空间来规划、起草和思考,你鼓励更深层次的推理、结构化输出和更少的盲点。将其视为初级助理准备简报:你需要大纲和质量检查,而不仅仅是最终草案。

三步方法:

  • 计划: 首先概述步骤
  • 执行: 执行大纲
  • 检查: 根据要求审查输出

示例 - 诉讼准备清单:

  • 计划: 识别数据源、保管人、保留政策
  • 执行: 起草要点清单
  • 检查: 反思缺失元素,如升级或恢复协议

其他示例:

  • 电子取证工作流程
    • 规划数据收集步骤
    • 起草工作流程
    • 对照合规标准检查
  • 证言摘要
    • 规划结构(事实、问题、承认)
    • 起草摘要
    • 对照笔录检查缺口
  • 合规审查
    • 规划关键领域(合同、政策、培训)
    • 起草审查大纲
    • 检查HIPAA或GDPR的覆盖范围

6. 平衡自主性

自主性描述了GPT-5在推动任务前进时采取的主动性程度。在一个极端,模型可能越权,在没有足够指导的情况下行动。在另一个极端,它可能通过不断向你请示而停滞进展。目标是达到平衡,模型贡献有意义的工作,同时将关键决策留给人。

两个极端:

  • 过于自主: 基于不可靠假设起草10页动议
  • 过于顺从: 在每个部分后请求许可

平衡中间点:

  • 允许假设,但要求明确标记
  • 明确定义范围和格式,如“3页带要点建议”
  • 要求在自然检查点暂停等待批准

平衡提示示例: 起草一份3页的驳回动议。必要时做出假设,但在末尾明确标记供我审查。未经我批准不得超出范围。

何时调整:

  • 如果出现幻觉或越权,降低自主性
  • 如果停滞或要求过多输入,提高自主性

平衡使用案例:

  • 诉讼准备 - 起草带有展品占位符的动议,标记为“待确认”
  • 电子取证工作流程 - 提出分阶段工作流程,注明待定决策,将最终选择留给你
  • 合规审查 - 生成带有已识别缺口的审查草案,每个都标记为待确认

提示GPT-5的核心是培养直觉,学习如何塑造指令,使生成式AI成为你工作中更好的伙伴。以上指导原则为我们提供了如何做到这一点的框架:精确、校准推理、提供结构、要求反思性迭代,并创建平衡的协作。

综合努力

归根结底,成功取决于提出更好的问题。每个提示都是澄清意图、设定边界并邀请生成式AI与我们共同思考的机会。当我们做好这一点时,输出不仅更准确;而且更有用、更一致,更容易集成到重要的工作流程中。

借助这些技术,我们正在与技术建立更智能的伙伴关系。像GPT-5这样的工具永远不会取代人类过程的细微差别、判断力或创造力,但它可以承担综合和结构的繁重工作,使我们人类能够专注于战略、倡导和洞察。

当你试验这些提示技术时,注意它们在哪里节省时间、减少返工或激发新见解。与你的团队、同事以及我们技术实验室分享这些成功,将你的结果发送至info@tcdi.com。我们越多地比较笔记和完善集体方法,我们与生成式AI的伙伴关系就会越有效。提示工程是一项新兴技能,我们每个人的深思熟虑实验,如果分享出来,都能帮助所有人前进。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计