提升高风险场景中AI模型可信度的新方法
医学影像中的模糊性给疾病诊断带来重大挑战。例如在胸部X光片中,肺部异常积液(胸腔积液)与脓液或血液积聚(肺浸润)的外观非常相似。人工智能模型可通过识别细微特征来辅助影像分析,提升诊断效率。但由于单张影像可能存在的多种状况,临床医生更需要一组可能性集合而非单一预测。
共形分类(conformal classification)作为一种产生可能性集合的方法,因其可直接在现有机器学习模型上实施而备受关注。但该方法生成的预测集往往过大,实用性受限。
某机构研究人员现已开发出简单有效的改进方法,可将预测集规模缩小高达30%,同时提升预测可靠性。更小的预测集能帮助临床医生更高效地确定正确诊断,从而优化患者治疗流程。该方法适用于多种分类任务(如野生动物图像物种识别),能提供更精简且准确的选项集合。
预测保证机制
用于高风险任务(如医学影像疾病分类)的AI助手通常会生成概率评分,但研究表明这些概率往往不准确。共形分类用最可能的诊断集合替代单一预测,并保证正确诊断包含在集合中。然而AI预测的内在不确定性常导致输出集合过大。
测试时增强技术
研究团队采用测试时增强(test-time augmentation, TTA)技术,通过对单张图像生成多种增强版本(裁剪、翻转、缩放等),聚合多个预测结果来提升准确性。该方法:
- 保留部分标注图像数据用于共形分类过程
- 在保留数据上学习最优增强聚合方式
- 对经TTA转换的预测执行共形分类
显著优势
与传统共形预测方法相比,TTA增强方法:
- 在多个标准图像分类基准中减少10%-30%预测集规模
- 在保持概率保证的前提下提升模型准确性
- 无需模型重新训练,实施简便
该方法对标注数据使用方式的优化,为后续研究提供了重要方向。未来工作将验证该技术在文本分类任务的有效性,并致力于降低计算需求。
本研究由某科技公司部分资助