临床大语言模型潜在脆弱性诊断技术研究

Mon, 08 Sep 2025 13:20:57 +0800

潜在诊断翻转率：临床大语言模型在代理扰动下的潜在脆弱性

临床决策支持大语言模型（LLMs）在静态基准测试中表现优异，但在面对微小但具有临床意义的输入变化时经常失效，例如掩码症状或否定发现。这些推理失败通常无法通过标准自然语言处理指标检测，因为这些指标对驱动诊断不稳定的潜在表示变化不敏感。