SCIN:皮肤病学代表性图像的新资源
健康数据集在研究和医学教育中扮演着关键角色,但创建反映真实世界的数据集具有挑战性。例如,皮肤病学状况在外观和严重程度上多种多样,并在不同肤色上表现不同。然而,现有的皮肤病学图像数据集往往缺乏日常状况(如皮疹、过敏和感染)的代表性,并偏向较浅肤色。此外,种族和民族信息经常缺失,阻碍了我们评估差异或创建解决方案的能力。
为应对这些限制,我们与斯坦福医学院的医生合作发布了皮肤状况图像网络(SCIN)数据集。我们设计SCIN以反映人们在线搜索的广泛关注点,补充临床数据集中通常发现的状况类型。它包含各种肤色和身体部位的图像,有助于确保未来的AI工具对所有人群有效工作。我们将SCIN数据集作为开放获取资源免费提供给研究人员、教育工作者和开发者,并采取了谨慎措施保护贡献者隐私。
数据集组成
SCIN数据集目前包含10,000多张皮肤、指甲或毛发状况的图像,由经历这些状况的个人直接贡献。所有贡献都是在美国的个人在知情同意下自愿进行的,属于机构审查委员会批准的研究。为了为回顾性皮肤科医生标记提供背景,贡献者被要求拍摄特写和稍远距离的图像。他们可以选择自我报告人口统计信息和晒黑倾向(自我报告的Fitzpatrick皮肤类型,即sFST),并描述与其关注点相关的纹理、持续时间和症状。
一到三名皮肤科医生为每个贡献标记最多五种皮肤病学状况,以及每个标签的置信度分数。SCIN数据集包含这些个体标签,以及从中得出的聚合和加权鉴别诊断,可用于模型测试或训练。这些标签是回顾性分配的,不等同于临床诊断,但它们允许我们将SCIN数据集中的皮肤病学状况分布与现有数据集进行比较。
虽然许多现有的皮肤病学数据集专注于恶性和良性肿瘤,旨在协助皮肤癌诊断,但SCIN数据集主要由常见的过敏性、炎症性和感染性状况组成。SCIN数据集中的大多数图像显示早期关注点——超过一半在拍照前不到一周出现,30%在拍照前不到一天出现。在这个时间窗口内的状况在医疗系统中很少见到,因此在现有的皮肤病学数据集中代表性不足。
我们还获得了皮肤科医生对Fitzpatrick皮肤类型(估计FST或eFST)的估计和外行标记者对Monk肤色(eMST)的估计。这使得能够将皮肤状况和皮肤类型分布与现有皮肤病学数据集进行比较。尽管我们没有选择性针对任何皮肤类型或肤色,但SCIN数据集具有平衡的Fitzpatrick皮肤类型分布(更多类型3、4、5和6),与来自临床来源的类似数据集相比。
Fitzpatrick皮肤类型量表最初是作为照片分型量表开发的,用于测量皮肤类型对紫外线辐射的反应,并广泛用于皮肤病学研究。Monk肤色量表是较新的10色阶量表,测量肤色而不是皮肤光型,捕捉了较深肤色之间更细微的差异。虽然这两个量表都不是为使用图像进行回顾性估计而设计的,但包含这些标签旨在促进未来对皮肤病学中皮肤类型和肤色代表性的研究。例如,SCIN数据集为美国人口中这些皮肤类型和肤色的分布提供了初步基准。
SCIN数据集具有较高的女性和年轻个体代表性,可能反映了多种因素的组合。这些可能包括皮肤状况发生率的差异、在线寻求健康信息的倾向以及不同人口统计群体对研究贡献意愿的变化。
众包方法
为了创建SCIN数据集,我们使用了一种新颖的众包方法,我们在与斯坦福医学院研究人员合著的研究论文中描述了这种方法。这种方法使个人能够在医疗保健研究中发挥积极作用。它使我们能够在人们健康关注的早期阶段接触到他们,可能在他们寻求正式护理之前。关键的是,这种方法使用网络搜索结果页面上的广告——许多人健康旅程的起点——来联系参与者。
我们的结果表明,众包可以产生高质量的数据集,垃圾邮件率低。超过97.5%的贡献是皮肤状况的真实图像。在执行进一步的过滤步骤以排除超出SCIN数据集范围的图像并删除重复项后,我们能够发布在8个月研究期间收到的近90%的贡献。大多数图像清晰且曝光良好。大约一半的贡献包括自我报告的人口统计信息,80%包含与皮肤状况相关的自我报告信息,如纹理、持续时间或其他症状。我们发现皮肤科医生回顾性分配鉴别诊断的能力更多地取决于自我报告信息的可用性,而不是图像质量。
虽然完美的图像去标识化永远无法保证,但保护贡献图像的个人隐私是创建SCIN数据集时的首要任务。通过知情同意,贡献者意识到潜在的重新识别风险,并建议避免上传具有识别特征的图像。提交后的隐私保护措施包括手动编辑或裁剪以排除可能识别的区域、反向图像搜索以排除公开可用的副本以及元数据删除或聚合。SCIN数据使用许可禁止尝试重新识别贡献者。
我们希望SCIN数据集将成为那些致力于推进包容性皮肤病学研究、教育和AI工具开发的人的有用资源。通过展示传统数据集创建方法的替代方案,SCIN为在自我报告数据或回顾性标记可行的领域创建更具代表性的数据集铺平了道路。
致谢
我们感谢所有合著者Abbi Ward、Jimmy Li、Julie Wang、Sriram Lakshminarasimhan、Ashley Carrick、Bilson Campana、Jay Hartford、Pradeep Kumar S、Tiya Tiyasirisokchai、Sunny Virmani、Renee Wong、Yossi Matias、Greg S. Corrado、Dale R. Webster、Dawn Siegel(斯坦福医学院)、Steven Lin(斯坦福医学院)、Justin Ko(斯坦福医学院)、Alan Karthikesalingam和Christopher Semturs。我们还感谢Yetunde Ibitoye、Sami Lachgar、Lisa Lehmann、Javier Perez、Margaret Ann Smith(斯坦福医学院)、Rachelle Sico、Amit Talreja、Annisah Um’rani和Wayne Westerlind对这项工作的基本贡献。最后,我们感谢Heather Cole-Lewis、Naama Hammel、Ivor Horn、Michael Howell、Yun Liu和Eric Teasley对研究设计和手稿的深刻评论。