多模态大模型跨语言一致性基准测试

Fri, 19 Sep 2025 14:11:39 +0800

跨越语言的旅程：多模态大语言模型中的跨语言一致性基准测试

多模态大语言模型（MLLMs）的快速发展显著增强了其实际应用能力。然而，在不同语言间实现一致性能，尤其是在整合文化知识时，仍然是一个重大挑战。为更好地评估这一问题，引入了两个新基准：KnowRecall和VisRecall，用于评估MLLMs的跨语言一致性。