扩展机器学习文档标准以提升安全性
摘要
本文基于对现有文献的广泛回顾,介绍了机器学习(ML)安全以及基于机器学习的系统、模型和数据集在研究和实践中的文档化现状。研究表明,机器学习从业者和组织对安全方面的意识普遍较低,且文档化方法往往缺乏标准化,导致机器学习文档整体质量不高。现有标准在实践中未被定期采纳,信息技术(IT)安全方面也常常未包含在文档中。由于这些因素,改进机器学习安全文档存在明确需求,这是解决机器学习安全现有差距的一个步骤。为实现这一目标,我们建议扩展现有的机器学习文档标准,以包含一个具有特定安全相关信息的安全部分。基于现有的模型卡片(Model Cards)和数据集数据表(Datasheets for Datasets)标准,本文提出了一种新颖的扩展方法,用于在机器学习文档中记录安全要求,并建议在所有机器学习文档中采纳这些发现。
评论
本文已被第33届IEEE国际需求工程研讨会(REW 2025)接受发表。
主题
密码学与安全(cs.CR);机器学习(cs.LG);软件工程(cs.SE)
引用信息
arXiv:2507.12003 [cs.CR]
(或此版本的 arXiv:2507.12003v1 [cs.CR])
DOI: https://doi.org/10.48550/arXiv.2507.12003
提交历史
来自:Cara Ellen Appel [查看电子邮件] [v1]
2025年7月16日星期三 07:57:57 UTC(84 KB)