大语言模型地理知识幻觉的评估与优化技术

本文提出针对大语言模型中地理知识幻觉的系统评估框架,基于知识图谱实现可控测评,并通过动态事实对齐方法(KTO优化)将模型性能提升29.6%,显著增强地理知识推理的可信度。

摘要

大语言模型(LLMs)虽具备广泛的世界知识(包括地理信息),但其生成的地理知识常存在不准确问题,导致地理幻觉(即错误或矛盾的 geospatial 信息表达),影响模型可靠性。尽管通用知识幻觉现象已被广泛研究,地理幻觉的系统性评估与缓解仍属空白。为此,本文提出基于结构化地理知识图谱的综合评估框架,对20种先进LLMs进行测评,揭示其地理知识缺陷。进一步提出基于Kahneman-Tversky优化(KTO)的动态事实对齐方法,在基准测试中实现29.6%的性能提升。实验证明,该框架与算法能有效增强LLMs在地理知识推理任务中的可信度。

核心方法

  1. 评估框架设计

    • 利用地理知识图谱构建可控测试环境,量化模型输出的地理事实一致性。
    • 覆盖位置关联、空间层级、属性推理等多维度指标。
  2. 动态事实对齐(KTO优化)

    • 将人类认知偏差理论融入损失函数,动态调整模型对矛盾地理知识的置信度。
    • 通过强化学习迭代优化生成结果与知识图谱的匹配度。

实验结果

  • 基准测试:20种LLMs平均地理幻觉率达42.7%,部分模型在空间层级任务中错误率超60%。
  • 优化效果:KTO方法使幻觉率降低至13.1%,推理速度保持原有水平。
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计