Apertus：完全开放、透明、多语言的大语言模型

2025年9月，某机构联合某研究中心宣布推出名为Apertus的大语言模型。该模型名称源自拉丁语“开放”，其最显著特点是整个开发过程完全开放，包括模型架构、权重参数、训练数据和配方均提供完整文档。

技术规格与访问方式

Apertus提供80亿和700亿两种参数规模的模型版本，较小版本更适合个人使用。模型采用宽松开源许可，支持教育研究和商业应用。专业用户可通过某机构的AI平台或Hugging Face平台下载部署。

作为完全开放的语言模型，Apertus允许研究人员检查训练过程的任何部分，这与仅开放部分组件的模型形成鲜明对比。开发团队将持续更新模型，成员包括来自某研究中心的专业工程师和研究人员。

模型使用15万亿token进行训练，覆盖1000多种语言，其中40%为非英语数据。特别包含了瑞士德语、罗曼什语等在传统大语言模型中代表性不足的语言。

Apertus以透明度为核心设计原则，确保训练过程完全可复现。研究团队同步发布了训练过程文档、源代码、模型权重和中间检查点。开发过程严格遵守瑞士数据保护法、版权法以及欧盟AI法案的透明度要求，训练数据仅使用公开可用内容，并经过严格过滤去除个人信息。

专业用户部署Apertus需要配套的服务器、云基础设施或特定用户界面。某机构将为开发者提供专用接口，商业客户可通过其主权AI平台访问模型。国际用户可通过公共AI推理工具使用该模型。

未来版本计划扩展模型家族，提升效率，并探索法律、气候、健康等领域的专业适配。在保持透明标准的同时，将集成更多功能模块。

模型权重和许可条款可通过Hugging Face平台获取