Discover如何在两天内从年度AWS预算中削减140万美元

本文详细介绍了Discover金融公司通过Red Hat OpenShift平台实施AWS成本优化策略,在两天内实现年度140万美元预算削减的技术实践,包括工作负载标记、容器元数据管理和团队文化转型等关键措施。

Discover如何在两天内从年度AWS预算中削减140万美元

还记得共享手机套餐吗?在世纪之交,整个家庭可能共享同一个移动电话分钟数池,只需几个小时的闲聊就会耗尽所有人的剩余通话时间。如今,类似的现象正在云环境中发生。

任何接触过公共云的人都可能遇到过意外的超额费用。这是个问题,但更麻烦的是,当您同时处理数百个实例时,很容易忽略单个实例的这种情况。在被Capital One收购的金融服务公司Discover,开发人员找到了一种解决超额问题的方法——并实现了显著的成本节约。

两天,140万美元

Discover于2022年迁移到Red Hat OpenShift。在此之前,该公司一直试图在CloudFoundry上固化,这是由Pivotal、VMware和Broadcom经常推广的平台即服务。

Discover的OpenShift总监Craig Katz表示,该公司现在使用OpenShift来管理其在Amazon Web Services内部的容器基础设施。为了将现有的1,200个工作负载迁移到OpenShift和Amazon Web Services,早期就决定专注于迁移的速度和质量,而将成本问题暂时搁置。

正如Katz所说:“您可以选择两个:快速、便宜或优质。我们选择了快速和优质。”

迁移完成后,Discover团队在平台上构建并部署了额外的300个绿地应用程序,这时Katz表示是时候考虑成本优化了。随着大约1,500个应用程序在AWS中运行,Katz说肯定有一些整体成本节约的工作可以做。关键在于在整个组织的应用程序组合中实施这些优化。

工作负载标记

首先,Katz为这样的努力提供的主要建议是为工作负载标记制定策略和自动化。Katz说团队最初没有实施这一点,结果他花了很多时间在电子表格中将工作负载与成本中心联系起来。现在,当在OpenShift中启动工作负载时,它默认将Katz作为所有者(并将他的部门作为成本中心)。如果开发人员正在启动工作负载,则会标记该开发人员的姓名,因此它会汇总到他们的成本中心。

这很重要,因为Discover内部有一个重大的金融科技努力,旨在优化成本并将IT支出直接与预算线联系起来。由于收购,还有与Capital One的IT基础设施整合的动力,标记工作负载也有助于这一努力。

技术和开发人员文化

即使在Katz设置两天的Game Day活动之前,他已经要求开发人员将容器的Requests元数据设置为最佳实践。然而,在整个组织中传播这一技巧的努力并没有完全成功。

Katz说,虽然有些人喜欢有文档,但其他人想要网络研讨会或课程,以便他们可以提问。虽然他确实尝试提供这样的选项,但成本优化并没有完全发生。

但是当他让所有人进入同一个房间并安排演讲者解释如何优化应用程序生命周期的每个部分时,魔法就发生了。每个演讲者都会讲话并展示一些幻灯片,然后观众中的团队会将他们学到的知识直接应用到他们的应用程序中。然后下一个演讲者开始。就好像他们连续两天进行实时优化传递一样。

当然,在Game Day活动之前,Katz已经带领IT团队进行了一些基于管理的AWS成本优化。“我们使用Turbonomic,这是IBM的产品。这帮助我们提高了所运行服务的效率。它进行密集打包和移动东西,以保持节点亲和性在需要的位置,只是不浪费空间,“Katz说。

“我们需要两天时间来做这件事吗?不。这是关于试图将人们聚集在一起,让他们沉浸在文化中以及我们为什么这样做。我们也在Discover工作了几个月,说,更新这两个值!看这里的这个仪表板,更新这个数字!我们只是没有获得太多的关注。所以这有点像将文化带入其中,因为技术显然是最重要的事情,但没有文化,它有时就会停滞不前和未被使用,“Katz说。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计