扩展机器学习文档标准以提升安全性

摘要

本文基于对现有文献的广泛回顾，介绍了机器学习（ML）安全以及基于机器学习的系统、模型和数据集在研究和实践中的文档化现状。研究表明，机器学习从业者和组织对安全方面的意识普遍较低，且文档化方法往往缺乏标准化，导致机器学习文档整体质量不高。现有标准在实践中未被定期采纳，信息技术（IT）安全方面也常常未包含在文档中。由于这些因素，改进机器学习安全文档存在明确需求，这是解决机器学习安全现有差距的一个步骤。为实现这一目标，我们建议扩展现有的机器学习文档标准，以包含一个具有特定安全相关信息的安全部分。基于现有的模型卡片（Model Cards）和数据集数据表（Datasheets for Datasets）标准，本文提出了一种新颖的扩展方法，用于在机器学习文档中记录安全要求，并建议在所有机器学习文档中采纳这些发现。

本文已被第33届IEEE国际需求工程研讨会（REW 2025）接受发表。

主题

密码学与安全（cs.CR）；机器学习（cs.LG）；软件工程（cs.SE）

引用信息

arXiv:2507.12003 [cs.CR]
（或此版本的 arXiv:2507.12003v1 [cs.CR]）
DOI: https://doi.org/10.48550/arXiv.2507.12003

提交历史

来自：Cara Ellen Appel [查看电子邮件] [v1]
2025年7月16日星期三 07:57:57 UTC（84 KB）

扩展机器学习文档标准以提升安全性

本文基于对现有文献的广泛回顾，探讨了机器学习安全及系统、模型和数据集文档化的现状，指出实践中安全意识和文档标准化不足的问题，并提出扩展现有文档标准以纳入安全相关信息的改进方法。

扩展机器学习文档标准以提升安全性

摘要

评论

主题

引用信息

提交历史