提示工程六大原则:来自OpenAI构建小时的经验总结
每月,OpenAI都会举办“构建小时”活动,团队成员与社区分享关于不断发展的生成式AI世界的见解。本月会议聚焦于提示工程,随着ChatGPT-5的发布,我们希望重点介绍他们的指导原则,帮助大家充分利用这个新工具版本。
在TCDI,我们理解精准沟通的价值,无论是在诉讼中起草论点、在电子取证中管理海量数据集、确保合规审查的准确性,还是为生成式AI系统构建正确的问题框架。本次构建小时活动中,专家们分享了提示工程的指导原则。这些不是严格的规则,而是实用的起点,能帮助我们在与所有大语言模型(不仅是ChatGPT-5)协作时获得更好结果。
TCDI的技术实验室与协作中心致力于探索新技术及其在法律行业的应用。我期待实践这些提示原则,压力测试它们如何应用于现实世界的法律、合规和技术工作流程。技术实验室是我们专门用于试点新兴技术的环境,我们可以在将其扩展到客户合作之前进行测试、优化和分享最佳实践。
以下是我对这些原则的理解、它们的重要性以及在实践中的应用示例。
1. 避免冲突指令
早期ChatGPT模型在接收到不精确或矛盾指令时经常会“揣测言外之意”。而GPT-5会按字面意思解读指令。如果你的指导存在两个方向上的冲突,模型不会自动调和,而是会反映这种冲突,削弱结果质量。
示例:
- 不佳示例: 写一份简洁的一页摘要,尽可能包含更多细节。
- 良好示例: 写一份一页摘要,突出三个主题,每个主题包含2-3个支持细节。
需要更清晰指令的信号:
- 多次迭代的响应感觉不一致
- 模型满足你请求的一部分但忽略其他部分
- 你需要花费额外时间编辑以修复矛盾
2. 使用适当的推理力度
将“推理力度”视为GPT-5投入任务的脑力程度。更高的力度会给出更深入、更谨慎的答案,但可能耗时更长、成本更高。较低的力度更快、更便宜,但可能更表面化。目标是匹配任务所需的力度,避免浪费时间或遗漏重要细节。
力度级别示例:
- 低力度: 快速回忆或格式化
- 列出五个美国州名
- 将这些要点转换为单句标题
- 从本段提取日期和参与方
- 中等力度: 平衡分析
- 将这份5页的案件摘要总结为一段
- 高力度: 复杂规划和综合
- 设计自动化合同审查计划,包括分阶段推出和风险分析
需要调整力度的信号:
- 如果模型遗漏步骤、忽略约束或过度简化,应增加提示中提供的力度
- 如果结果感觉臃肿、过度解释或对于当前任务过慢,应减少提示中给出的细节
3. 有意构建提示结构
格式化不是表面功夫,而是认知过程。你构建提示的方式告诉模型如何组织其推理。松散、非结构化的提示会产生松散、非结构化的答案(垃圾进,垃圾出)。明确的格式化给GPT-5提供了遵循的地图。
我们发现这在输出用于案件时间线、特权日志或质量控制工作流程等任务时最为重要。结构化提示减少返工,提高一致性,并使下游自动化成为可能。
示例提示 - 证言摘要:
- 总结附带的证言笔录
- 长度:500-1000词
- 重点:关键证人承认事项
- 约束:为“关键承认”提供要点(每点一条)和证言流程的叙述性摘要
需要更多结构的信号:
- 不同迭代间的输出差异很大
- 模型忽略长度或重点等约束
- 你在使用结果前需要花费额外时间重新格式化
4. 尝试元提示
本质上,元提示是使用大语言模型开发或优化提示,以获得更好、更一致的结果。因此,在要求GPT-5修复输出之前,先请它简要诊断错误发生的原因。然后使用该诊断来驱动有针对性的提示修订。在精益六西格玛中,这是DMAIC的“分析”阶段,在跳转到实施解决方案之前识别问题的根本原因。
为何有效:
- 揭示隐藏假设。例如,优先考虑责任而非损害赔偿
- 通过解决根本原因而非仅解决症状来防止修补式修复
- 产生更一致、可解释的改进,这对可辩护性文件至关重要
何时使用元提示:
- 在同一约束(长度、重点、引用风格)上重复出错
- 幻觉或过度自信的摘要
- 当输出馈入时间线或质量控制等工作流程时出现格式化漂移
三步循环:
- 诊断(简短、具体): 要求用40词或更少说明原因
- 修订: 重述约束并仅请求更正信息
- 验证: 让模型使用通过/失败清单审核其输出是否符合约束
响应示例:
- 问题: 证言摘要忽略了损害赔偿
- 诊断: 我强调了责任,因为提示首先突出了它。没有明确指示讨论损害赔偿。假设损害赔偿细节超出范围
- 修订: 在保持字数限制的同时添加损害赔偿子部分
- 验证: 清单确认责任和损害赔偿都得到处理
5. 为规划和自我反思留出空间
当GPT-5不必直接提供答案时,它表现最佳。通过给它空间来规划、起草和思考,你鼓励更深层次的推理、结构化输出和更少的盲点。将其视为初级助理准备简报:你需要大纲和质量检查,而不仅仅是最终草案。
三步方法:
- 计划: 首先概述步骤
- 执行: 执行大纲
- 检查: 根据要求审查输出
示例 - 诉讼准备清单:
- 计划: 识别数据源、保管人、保留政策
- 执行: 起草要点清单
- 检查: 反思缺失元素,如升级或恢复协议
其他示例:
- 电子取证工作流程
- 规划数据收集步骤
- 起草工作流程
- 对照合规标准检查
- 证言摘要
- 规划结构(事实、问题、承认)
- 起草摘要
- 对照笔录检查缺口
- 合规审查
- 规划关键领域(合同、政策、培训)
- 起草审查大纲
- 检查HIPAA或GDPR的覆盖范围
6. 平衡自主性
自主性描述了GPT-5在推动任务前进时采取的主动性程度。在一个极端,模型可能越权,在没有足够指导的情况下行动。在另一个极端,它可能通过不断向你请示而停滞进展。目标是达到平衡,模型贡献有意义的工作,同时将关键决策留给人。
两个极端:
- 过于自主: 基于不可靠假设起草10页动议
- 过于顺从: 在每个部分后请求许可
平衡中间点:
- 允许假设,但要求明确标记
- 明确定义范围和格式,如“3页带要点建议”
- 要求在自然检查点暂停等待批准
平衡提示示例: 起草一份3页的驳回动议。必要时做出假设,但在末尾明确标记供我审查。未经我批准不得超出范围。
何时调整:
- 如果出现幻觉或越权,降低自主性
- 如果停滞或要求过多输入,提高自主性
平衡使用案例:
- 诉讼准备 - 起草带有展品占位符的动议,标记为“待确认”
- 电子取证工作流程 - 提出分阶段工作流程,注明待定决策,将最终选择留给你
- 合规审查 - 生成带有已识别缺口的审查草案,每个都标记为待确认
提示GPT-5的核心是培养直觉,学习如何塑造指令,使生成式AI成为你工作中更好的伙伴。以上指导原则为我们提供了如何做到这一点的框架:精确、校准推理、提供结构、要求反思性迭代,并创建平衡的协作。
综合努力
归根结底,成功取决于提出更好的问题。每个提示都是澄清意图、设定边界并邀请生成式AI与我们共同思考的机会。当我们做好这一点时,输出不仅更准确;而且更有用、更一致,更容易集成到重要的工作流程中。
借助这些技术,我们正在与技术建立更智能的伙伴关系。像GPT-5这样的工具永远不会取代人类过程的细微差别、判断力或创造力,但它可以承担综合和结构的繁重工作,使我们人类能够专注于战略、倡导和洞察。
当你试验这些提示技术时,注意它们在哪里节省时间、减少返工或激发新见解。与你的团队、同事以及我们技术实验室分享这些成功,将你的结果发送至info@tcdi.com。我们越多地比较笔记和完善集体方法,我们与生成式AI的伙伴关系就会越有效。提示工程是一项新兴技能,我们每个人的深思熟虑实验,如果分享出来,都能帮助所有人前进。