大语言模型评估中认知偏差的考量框架

Mon, 15 Sep 2025 04:31:59 +0800

在计算语言学协会（ACL）2024年会议上发表的一篇立场论文，提出了一个更准确评估大语言模型（LLMs）的人类评估框架。

大语言模型能够生成极其流畅的自然语言文本，而这种流畅性可能会误导人类忽视内容的质量。例如，心理学研究表明，高流畅性的内容可能被认为比低流畅性内容更真实和有用。对流畅语言的偏好是认知偏差的一个例子，这是大脑采取的一种捷径，虽然在进化上有用，但可能导致系统性错误。

人类评估 on 办公AI智能小助手