!exploitable Episode Three - Devfile Adventures
18 Mar 2025 - Posted by Francesco Lacerenza
引言
我知道,我们已经说过很多次了,但以防你刚刚开始关注,Doyensec团队当时正在一艘地中海游轮上进行公司团建。为了在派对间隙消磨时间,我们进行了一些黑客技术分析,研究现实世界中的漏洞,并形成了这个!exploitable系列博文。
在第一部分中,我们介绍了在物联网ARM设备上的漏洞利用之旅,而第二部分则讲述了我们试图利用电影《黑客帝国:重装上阵》中Trinity所用漏洞的经历。
在这一集中,我们将深入探讨GitLab中CVE-2024-0402的漏洞利用过程。就像洋葱一样,这个漏洞的表面之下总是还有另一层,从YAML解析器的差异到解压缩函数中的路径遍历,最终实现在GitLab中的任意文件写入。
当时没有公开的漏洞概念验证(PoC)发布,而编写PoC的过程本身变成了一场冒险,值得在原作者的博文基础上进行扩展,补充与PoC相关的信息来完成这个循环。
一些背景
该漏洞影响了GitLab的Workspaces功能。长话短说,该功能允许开发人员即时启动集成开发环境(IDE),并已配置好所有依赖项、工具和配置。
整个Workspaces功能依赖于多个组件,包括一个运行的Kubernetes GitLab Agent和一个devfile配置文件。
Kubernetes GitLab Agent:Kubernetes GitLab Agent将GitLab连接到Kubernetes集群,允许用户启用部署过程自动化,并更轻松地集成GitLab CI/CD流水线。它也允许创建Workspaces。
Devfile:这是一个定义容器化开发环境的开放标准。简单来说,它使用YAML文件来配置特定项目所需的工具、运行环境和依赖项。
一个devfile配置示例(需放置在GitLab仓库中名为.devfile.yaml的文件里):
|
|
漏洞详情
让我们从公开的信息开始,并结合额外的代码上下文进行丰富。
GitLab使用devfile Gem(当然是Ruby写的),通过调用外部的devfile二进制程序(用Go编写)来处理在特定仓库中创建Workspace期间的.devfile.yaml文件。
在Workspaces应用的devfile预处理过程中,一个名为validate_parent的特定验证器在GitLab中被PreFlattenDevfileValidator调用。
|
|
但parent选项是什么?根据Devfile文档:
如果你指定了一个父devfile,那么给定的devfile将从其父级继承所有行为。但你仍然可以使用子devfile来覆盖父devfile的某些内容。
接着,文档描述了三种父级引用类型:
- 通过注册表引用父级 - 远程devfile注册表
- 通过URI引用父级 - 静态HTTP服务器
- 通过Kubernetes资源标识父级 - 可用的命名空间
与任何其他远程获取功能一样,这值得审查以发现漏洞。但乍一看,该选项似乎被validate_parent阻止了。
YAML解析器差异带来的机会
众所周知,即使是最常用的特定标准的实现,也可能与规范中定义的内容存在细微偏差。在这种情况下,我们需要利用Ruby和Go之间的YAML解析器差异。
原作者为我们的“差异笔记”贡献了一个新技巧。在YAML规范中:
- 单个感叹号
!用于自定义或应用特定的数据类型1my_custom_data: !MyType "some value" - 双感叹号
!!用于内置的YAML类型1bool_value: !!bool "true"
他发现,本地YAML标记符号!(RFC参考)在Ruby的yaml库中仍然会激活二进制格式的base64解码,而Go的gopkg.in/yaml.v3只是丢弃它,导致了以下行为:
|
|
因此,可以通过validate_parent函数向GitLab传递一个带有parent选项的devfile,并使其在devfile二进制程序执行时生效。
任意文件写入
此时,我们需要转向在devfile二进制程序(Go实现)中发现的一个漏洞。
在深入研究了依赖项的依赖项之后,研究人员发现了decompress函数。该函数从注册表的库中获取tar.gz存档,并在GitLab服务器内部解压缩文件。随后,这些文件应被移动到部署的Workspace环境中。
以下是getResourcesFromRegistry使用的易受攻击的解压缩函数:
|
|
该函数打开tarFile,并使用tarReader.Next()遍历其内容。只有类型为tar.TypeDir和tar.TypeReg的内容会被处理,从而防止符号链接和其他嵌套利用。
然而,代码行target := path.Join(targetDir, filepath.Clean(header.Name))容易受到路径遍历攻击,原因如下:
header.Name来自由devfile注册表提供的远程tar存档- 众所周知,
filepath.Clean无法防止相对路径上的路径遍历(../不会被移除)
执行结果类似如下:
|
|
有很多脚本可以创建利用这种目录遍历模式的有效恶意存档(例如,evilarc.py)。
串联各个环节
- devfile库中从远程注册表获取文件的解压缩问题,允许包含恶意
.tar存档的devfile注册表在devfile客户端系统内写入任意文件。 - 在GitLab中,开发者可以精心构造一个“坏但有效”的
.devfile.yaml定义,其中包含parent选项,该选项将强制GitLab服务器使用恶意注册表,从而触发在服务器本身的任意文件写入。
利用此漏洞的要求是:
- 以能够向仓库提交代码的开发者身份访问目标GitLab
- GitLab实例上正确配置了Workspace功能(v16.8.0及以下版本)
让我们来利用它!
配置环境
为了确保你了解全貌,我必须告诉你,在游轮上、网速很慢的情况下配置GitLab中的Workspaces是什么感觉——简直是噩梦!
当然,有关于如何操作的文档,但今天你将额外获得一些发现:
- 遵循GitLab 16.8的文档页面,而不是最新的,因为配置已更改。不要像我们一样,在海上浪费宝贵的欢乐时光。
- 这个功能变化太大了,他们甚至移除了GitLab 16.8所需的容器镜像。因此,你需要修补缺失的
web-ide-injector容器镜像。将1 2ubuntu@gitlabServer16.8:~$ find / -name "editor_component_injector.rb" 2>/dev/null /opt/gitlab/embedded/service/gitlab-rails/ee/lib/remote_development/workspaces/create/editor_component_injector.rbweb-ide-injector镜像在129行的值替换为:1registry.gitlab.com/gitlab-org/gitlab-web-ide-vscode-fork/gitlab-vscode-build:latest - GitLab Agent必须启用
remote_development选项以允许Workspaces。 以下是一个有效的config.yaml文件示例:1 2 3 4 5 6 7remote_development: enabled: true dns_zone: "workspaces.gitlab.yourdomain.com" observability: logging: level: debug grpc_level: warn
祝你在配置时好运。
开始构造
如前所述,这个漏洞链就像洋葱一样层层叠叠。这是一张典型的2025年AI生成的图片,为我们勾勒出了轮廓:
根据公开信息,如果我们想利用它,需要完成以下任务:
- 部署一个自定义的devfile注册表,按照原始仓库的说明进行,结果证明这很容易。
- 通过包含我们的路径遍历
.tar文件使其变得恶意,以覆盖GitLab实例中的某些内容。 - 在目标GitLab仓库中添加一个指向该恶意注册表的
.devfile.yaml文件。
为了确定恶意tar文件应该放在哪里,我们必须退一步,阅读更多的代码。特别是,我们必须了解易受攻击的decompress函数被调用时的上下文。
最终我们阅读了PullStackByMediaTypesFromRegistry函数,该函数用于从给定的注册表URL拉取具有允许媒体类型的指定技术栈到某个目标目录。
参见library.go:293
|
|
突出的代码模式表明,其中涉及devfile注册表的技术栈,并且它们的结构中包含一些archive.tar文件。
为什么devfile技术栈要包含一个tar文件?
包中可能包含一个
archive.tar文件,用于分发入门项目或预配置的应用程序模板。它帮助开发人员快速设置工作区,包含示例代码、配置和依赖项。
在devfile注册表构建过程中进行的一些快速的GitHub搜索显示,我们的目标.tar文件应放置在注册表项目内的stacks/<STACK_NAME>/<STACK_VERSION>/archive.tar路径下,与部署特定版本所包含的devfile.yaml文件位于同一目录。
因此,我们自定义注册表中用于路径遍历的tar文件的目标位置是:
|
|
构建并运行恶意devfile注册表
构建我们的自定义注册表需要一些额外的工作(无法使构建脚本正常工作,不得不手动编辑),但我们最终成功将我们的archive.tar(例如,使用evilarc.py创建)放在了正确的位置,并制作了一个正确的index.json来提供服务。最终可复用的结构可以在我们的PoC仓库中找到,这样可以节省你构建devfile注册表镜像的时间。
运行恶意注册表的命令:
docker run -d -p 5000:5000 --name local-registrypoc registry:2用于运行一个本地容器注册表,该注册表将被devfile注册表用来存储实际的技术栈(见黄色高亮部分)docker run --network host devfile-index用于运行使用官方仓库构建的恶意devfile注册表。在我们的PoC仓库中可以找到它。
触发漏洞 💥
一旦你有一个目标GitLab实例可以访问的运行中的注册表,你只需要在GitLab中以开发者身份进行身份验证,并编辑仓库的.devfile.yaml文件,利用之前展示的YAML解析器差异指向它。以下是一个你可以使用的示例:
|
|
要触发文件写入,只需在编辑过的仓库中启动一个新的Workspace并等待。
很好!我们已经成功地在/tmp/plsWorkItsPartyTime.txt中写入了Hello CVE-2024-0402!。
接下来可以做什么…
我们实现了文件写入,但我们不能就此止步,因此我们研究了一些可靠的升级方法。
首先,我们检查了执行文件写入的系统用户,使用了一个在GitLab服务器上的会话。
|
|
显然,我们的默认用户是git,这是GitLab内部一个相当重要的用户。
在检查了可写文件以寻找快速突破口后,我们发现它似乎被加固了,没有大量可编辑的配置文件,正如预期的那样。
|
|
一些有趣的文件等待着被覆盖,但你可能已经注意到了最快但不算体面的入口:/var/opt/gitlab/.ssh/authorized_keys。
值得注意的是,你可以将SSH密钥添加到你的GitLab账户,然后使用它通过SSH以git用户身份执行代码相关操作。authorized_keys文件由GitLab Shell管理,它会从用户配置文件中添加SSH密钥,并将其强制放入一个受限的shell中,以进一步管理/限制用户的访问级别。
以下是将你的配置文件SSH密钥添加到GitLab时,添加到authorized_keys文件中的一行示例:
|
|
由于我们获得了任意文件写入能力,我们可以直接用包含一个我们可以使用的非受限密钥的authorized_keys文件替换原来的。回到我们的漏洞准备阶段,为此创建一个新的.tar文件:
|
|
此时,在你的恶意devfile注册表中替换archive.tar,重建其镜像并运行它。准备好后,通过在GitLab Web界面中创建一个新的Workspace来再次触发漏洞。
几秒钟后,你应该能够以不受限制的git用户身份进行SSH连接。
下面我们还展示了如何更改GitLab Web根用户的密码:
|
|
最后,你就可以在目标Web实例中以root用户身份进行身份验证了。
结论
我们的目标是为CVE-2024-0402构建一个PoC。尽管时间和网络连接受限,我们还是成功地完成了。尽管如此,在准备GitLab Workspaces环境时出现了大量的配置错误,在数小时的设置后功能本身几乎无法工作,我们几乎要放弃了。这再次证明,正因为配置时间限制,只有少数人涉足的地方才能发现非常优秀的漏洞。
向发现该漏洞链的joernchen致敬。
这个漏洞不仅很棒,而且他在这篇文章中还出色地描述了他所遵循的研究路径。我们很高兴能够利用它,并且希望我们的公开漏洞利用能够为人们节省时间!
资源
- https://gitlab-com.gitlab.io/gl-security/security-tech-notes/security-research-tech-notes/devfile/
- https://devfile.io/docs/2.1.0/building-a-custom-devfile-registry
其他相关博文:
- ksmbd - Exploiting CVE-2025-37947 (3/3) - 08 Oct 2025
- SCIM Hunting - Beyond SSO - 08 May 2025
- !exploitable Episode Two - Enter the Matrix - 27 Feb 2025
- !exploitable Episode One - Breaking IoT - 11 Feb 2025