扩展机器学习文档标准以提升安全性

本文基于对现有文献的广泛回顾,探讨了机器学习安全及系统、模型和数据集文档化的现状,指出实践中安全意识和文档标准化不足的问题,并提出扩展现有文档标准以纳入安全相关信息的改进方法。

扩展机器学习文档标准以提升安全性

摘要

本文基于对现有文献的广泛回顾,介绍了机器学习(ML)安全以及基于机器学习的系统、模型和数据集在研究和实践中的文档化现状。研究表明,机器学习从业者和组织对安全方面的意识普遍较低,且文档化方法往往缺乏标准化,导致机器学习文档整体质量不高。现有标准在实践中未被定期采纳,信息技术(IT)安全方面也常常未包含在文档中。由于这些因素,改进机器学习安全文档存在明确需求,这是解决机器学习安全现有差距的一个步骤。为实现这一目标,我们建议扩展现有的机器学习文档标准,以包含一个具有特定安全相关信息的安全部分。基于现有的模型卡片(Model Cards)和数据集数据表(Datasheets for Datasets)标准,本文提出了一种新颖的扩展方法,用于在机器学习文档中记录安全要求,并建议在所有机器学习文档中采纳这些发现。

评论

本文已被第33届IEEE国际需求工程研讨会(REW 2025)接受发表。

主题

密码学与安全(cs.CR);机器学习(cs.LG);软件工程(cs.SE)

引用信息

arXiv:2507.12003 [cs.CR]
(或此版本的 arXiv:2507.12003v1 [cs.CR])
DOI: https://doi.org/10.48550/arXiv.2507.12003

提交历史

来自:Cara Ellen Appel [查看电子邮件] [v1]
2025年7月16日星期三 07:57:57 UTC(84 KB)

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计