大语言模型地理知识幻觉的评估与优化技术

摘要

大语言模型（LLMs）虽具备广泛的世界知识（包括地理信息），但其生成的地理知识常存在不准确问题，导致地理幻觉（即错误或矛盾的 geospatial 信息表达），影响模型可靠性。尽管通用知识幻觉现象已被广泛研究，地理幻觉的系统性评估与缓解仍属空白。为此，本文提出基于结构化地理知识图谱的综合评估框架，对20种先进LLMs进行测评，揭示其地理知识缺陷。进一步提出基于Kahneman-Tversky优化（KTO）的动态事实对齐方法，在基准测试中实现29.6%的性能提升。实验证明，该框架与算法能有效增强LLMs在地理知识推理任务中的可信度。

核心方法

评估框架设计
- 利用地理知识图谱构建可控测试环境，量化模型输出的地理事实一致性。
- 覆盖位置关联、空间层级、属性推理等多维度指标。
动态事实对齐（KTO优化）
- 将人类认知偏差理论融入损失函数，动态调整模型对矛盾地理知识的置信度。
- 通过强化学习迭代优化生成结果与知识图谱的匹配度。

实验结果

基准测试：20种LLMs平均地理幻觉率达42.7%，部分模型在空间层级任务中错误率超60%。
优化效果：KTO方法使幻觉率降低至13.1%，推理速度保持原有水平。