基于生成式AI图像合成促进AI皮肤病变分类器的公平性评估
深度学习及其边缘应用的近期进展对黑色素瘤等皮肤癌的常规筛查具有革命性潜力。伴随这项技术的预期益处,不可预见和固有偏见带来的潜在风险也随之出现。因此,评估和改进此类系统的公平性至关重要。
公平性评估的一个关键挑战在于确保评估数据集充分代表不同个人可识别信息(性别、年龄和种族)及其他少数群体。针对这一挑战,本研究利用最先进的生成式AI(GenAI)LightningDiT模型来评估公开可用的黑色素瘤分类器的公平性。
研究结果表明,使用高度真实的合成数据进行公平性评估是一个有前景的方向。然而,我们的发现表明,当用于评估的黑色素瘤检测模型基于与合成图像所依据数据集不同的数据进行训练时,验证公平性变得困难。
尽管如此,我们提出该方法为使用合成数据衡量和增强医疗影像GenAI系统公平性提供了有价值的新途径。