如何追踪和审计机器生成文本的证据效力

本文探讨AI系统如何通过语法操作生成具有法律证据效力的文本,提出从句级审计方法来验证这些文本是反映事实还是仅具备结构合理性。

问题:无目击者的报告

警方报告、保险叙述和法律陈述本应反映某人看到、听到或经历的事情。传统上,这些文件由人类官员根据直接观察或证词撰写。但这种模式正在改变。

在美国及其他地区,警察部门正在采用人工智能系统,根据随身摄像机音频、官员口述或元数据生成完整的书面报告。这些系统快速、标准化且一致。但有一个问题:它们从未目睹过它们描述的事件。

这意味着语言是在没有感知的情况下产生的。然而,这些报告听起来像法律证词。它们包括权威陈述、因果关系、证据引用和行动描述。因此,核心问题是:

如果一个句子没有任何人类实际说过、目睹过或审查过,它能否被视为证据?

令人不安的是,答案往往是肯定的。

论文揭示的内容

论文《预测性证词:AI生成的警方报告和司法叙述中的编译语法》研究了这些AI系统如何作为编译语法引擎运行。这意味着它们遵循预设的语言规则(如模板和语法),将混乱的输入转化为清晰、法律化的文本。

但在此过程中,它们引入了论文所称的“操作条件证据”。这是AI做出的选择,改变了句子的语气、权威性以及法院的解释方式。论文确定了六个核心操作:

  1. 代理删除:移除行为主体
  2. 模态弱化:用“可能”、“可以”或“显然”替换强烈主张
  3. 证据框架插入:添加“记录显示…”等短语而不展示记录
  4. 时间锚点转移:将事件时间改为系统时间
  5. 序列名词化:将动作转化为静态名词
  6. 准引用:使转述听起来像直接引用

这些操作中的每一个都改变了报告作为证据的功能。它们不仅描述发生了什么,还塑造了责任、确定性和因果关系的感知方式。

重要性

这些报告被用于实际决策:逮捕、保险拒赔、法庭文件。而且通常没有人检查句子是如何生成的。例如:

  • “对象在命令发出后被拘留”(谁发出了命令?什么命令?)
  • “系统记录显示嫌疑人否认参与”(这些记录在哪里?谁听到了否认?)
  • “可能有强行进入”(这是合理依据还是只是含糊其辞?)

这种语言可以在法律系统中畅通无阻,因为它听起来正确。它符合机构期望。但它可能在结构上是空洞的——没有行为主体、没有验证、没有现实依据。

解决方案:使语法可测试

论文没有提议禁止AI生成的报告,而是提出了更聪明的方案:使语法可审计。它引入了一个从混乱输入到正式报告的四阶段路径:

  1. 输入流:音频、时间日志、表格
  2. 编译日志:系统用于编写的内容
  3. 操作追踪:在何处使用了哪些操作
  4. 证据表面:最终报告

通过这种设置,机构可以追踪句子是如何形成的,哪些操作影响了它,以及它是否有任何证据弱点。论文还提出了一项筛选测试:如果一个从句没有已知的说话者、引用不可验证的来源并转移时间参考,则应标记、更正或排除。

创新之处

这种方法不依赖于猜测AI的“意图”——因为它没有意图。它着眼于结构。它将句子视为一个动作。如果结构在没有实质内容的情况下创造了证据的外观,那么这种结构必须被测试。

这是一个律师、法官、工程师和伦理学家都可以应用的解决方案。而且它不需要拆除自动化工作流程。大多数工件——日志、提示、哈希、编辑——已经存在。我们只需要使用它们。

阅读完整论文

📄 DOI: https://doi.org/10.5281/zenodo.16689540
系列:权力的语法
作者:Agustin V. Startari

关于作者

Agustin V. Startari是一位语言理论家和历史研究研究员。他的工作专注于句法权威、法律话语的自动化以及机器生成语言的结构限制。
ORCID: 0009-0001-4714-6539
SSRN作者页面:链接

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计