利用GKE计算类和灵活CUD解锁新一代虚拟机

本文详细介绍如何结合GKE计算类和灵活承诺使用折扣,实现新一代虚拟机系列的无缝迁移。通过实际代码示例展示配置方法,帮助企业在保证应用可用性的同时优化性能与成本,涵盖N4、C4等新机型与回退机制。

采用新一代虚拟机系列:GKE计算类与灵活CUD的结合

组织持续寻求通过云计算最新进展获得竞争优势。新的Google Compute Engine和Google Kubernetes Engine(GKE)第四代机器系列(包括N4、C4、C4A、C4D等)在性能、成本效益和功能方面均有显著提升。然而,迁移到新硬件并非总是直截了当。团队常面临兼容性测试、区域容量和财务承诺管理等挑战,这些都会延缓采用进程。

好消息是,两个强大的Google Cloud功能结合使用时,提供了一条战略性的成本效益路径,可在没有常规开销的情况下采用新机器系列。通过将GKE计算类的技术敏捷性与计算灵活承诺使用折扣(Flex CUD)的财务适应性相结合,您可以更快创新、保持弹性并优化成本。更妙的是,计算Flex CUD还允许对Autopilot和Cloud Run的消费享受折扣——使您能够轻松为工作负载选择适当的计算资源。让我们深入探讨。

挑战:克服硬件采用障碍

虽然采用最新机器系列可解锁新级别的性能和效率,但组织在过渡期间可能面临一些挑战:

  • 兼容性测试:在全面迁移之前,团队需要验证其应用在新机器系列上是否按预期执行。这需要一种安全引入新硬件以收集性能数据并确保兼容性的策略。
  • 应对区域容量:随着新机器系列扩展到更多区域,其可用性可能有所不同。这需要备用选项来确保应用可用性不受特定位置容量限制的影响。
  • 协调财务承诺:基于资源的CUD提供了极佳的价值,但绑定到特定机器系列,对于希望在现有承诺期内采用更新、更具成本效益硬件的团队来说灵活性较低。
  • 工作负载迁移:跨多种机器类型配置、迁移和管理工作负载的过程在操作上可能很复杂。这需要平台团队进行大量协调才能顺利执行。

解决方案第一部分:GKE计算类

GKE计算类为硬件采用挑战提供了优雅的技术解决方案。您无需将工作负载绑定到单一机器类型,而是可以定义GKE可用于自动扩展的机器系列优先级列表。这为您提供了一种灵活且有弹性的方式,以逐步集成尖端技术。

使用计算类,您可以定义一个策略,告诉GKE优先考虑新的成本效益机器系列(如N4),但如果首选不可用,则自动回退到您已在使用的成熟机器系列(如N2或N2D)。计算类允许您通过逐步将新工作负载订阅到计算类来安全地分波次推出新硬件。这有助于最小化操作风险和停机时间。

工作原理:示例

假设您希望为无状态Web应用利用新N4机器系列的卓越价格性能,但希望对意外的大流量峰值回退到上一代N2系列。

您可以创建一个具有机器系列优先级列表的自定义ComputeClass对象:

ComputeClass清单(n4-fallback-class.yaml)

1
2
3
4
5
6
7
8
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: n4-fallback-class
spec:
  priorities:
    - machineFamily: n4
    - machineFamily: n2

这个简单定义指示GKE集群自动扩缩器首先尝试从N4系列配置节点。如果无法做到,它会自动尝试列表中的下一个选项,即N2系列。

接下来,您可以使用nodeSelector在工作负载的pod规范中引用此类。

工作负载Kubernetes清单

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-web-app
spec:
  replicas: 3
  selector:
    matchLabels:
      app: my-web-app
  template:
    metadata:
      labels:
        app: my-web-app
    spec:
      nodeSelector:
        cloud.google.com/compute-class: n4-fallback-class
      containers:
      - name: web-server
        image: "your-web-app-image"
        resources:
          requests:
            cpu: "1"
            memory: "3.5Gi"

您可以通过简单地将cloud.google.com/compute-class: n4-fallback-class nodeSelector标签添加到相关的工作负载并重新部署它们,使用此计算类配置逐步将工作负载迁移到N4。

实际成功案例:Shopify安全采用新硬件

这种技术和财务灵活性的强大组合不仅仅是理论上的。当今领先的公司正在使用它来推动实际成果。在Google Cloud Next ‘25上,Shopify的首席工程师Justin Reid分享了公司如何利用GKE计算类来支持世界上最大的GKE舰队之一。

GKE计算类使Shopify能够在黑色星期五/网络星期一期间通过实施上述确切策略来应对大规模流量:他们定义了一个计算类,优先考虑新的N4机器,并包括N2机器作为无缝回退选项。

“计算类在帮助Shopify在最需求事件期间扩展方面发挥了关键作用…它为我们消除了大量操作复杂性…” - Justin Reid,首席工程师,Shopify

在此观看完整的Next ‘25会议

另一个示例:使用C系列家族的高性能工作负载

对于要求高的工作负载,C系列VM是一个受欢迎的选择,提供持续高性能和对企业功能的访问,如本地附加SSD、高级维护控制、更大的VM规格和更高的CPU频率。您可以设置一个计算类来优先考虑新的高性能选项,如C4和C4D,它们比前代VM提供了引人注目的价格性能提升,并包括回退到您广泛使用的VM。

您的ComputeClass可以将C4或C4D设置为主VM,另一个作为回退选项,C2 VM作为最后选择。这可以使您最大化最新机器类型的可获得性,并自信地利用多个前代平台的供应而不牺牲可用性。

您的ComputeClass清单可能如下所示:

1
2
3
4
5
6
7
8
9
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: c4-c4d-fallback-class
spec:
  priorities:
    - machineFamily: c4
    - machineFamily: c4d
    - machineFamily: c2 # 或 c2d

通过在您工作负载的pod规范中引用cloud.google.com/compute-class: c4-c4d-fallback-class,您的要求高的应用始终落在最性能和成本效益的可用C系列VM上,并拥有可靠的备用计划。

解决方案第二部分:计算灵活CUD

技术敏捷性只是等式的一半。基于支出的计算灵活CUD提供了相匹配的商业灵活性。与基于资源的CUD(为您提供一种特定机器系列的最大折扣)不同,Flex CUD适用于您跨广泛机器系列(包括Gen4,如N4和C4)的总合格计算支出,同时利用回退选项(如C2、N2)。

当您购买计算灵活CUD时,您承诺在一年或三年期内对计算资源(vCPU、内存和本地SSD)的特定小时支出,作为回报获得显著折扣(三年期通用VM最高可享受46%的折扣)。

工作原理:示例

想象您购买了一个三年期计算Flex CUD。您的GKE集群使用前面示例中的n4-fallback-class,最初在N4机器上运行您的工作负载。您的计算Flex CUD折扣自动应用于该使用情况。

现在,假设您区域中的突然需求激增导致GKE的计算类策略配置N2机器以临时处理额外负载。关键是,您的计算Flex CUD折扣自动跟随您的工作负载,您的折扣现在应用于N2机器。您的节省跟随您的支出,使您有信心采用新硬件而不失去承诺使用折扣。

实际成功案例:Verve Group

Verve Group SE是一家领先的数字媒体公司,通过AI驱动的广告软件解决方案赋能广告商和发布商,连接他们以提供有影响力的活动,重点关注第一方数据和隐私优先技术。

“Verve使用各种机器系列,包括新的C4D以及其他VM,如C3D和N2D。我们使用自定义计算类来编排回退,按区域成本/性能排名。我们的大部分支出由计算Flex CUD覆盖,这在为我们消费的许多机器系列提供折扣灵活性方面发挥着至关重要的作用。” - Pablo Loschi,首席系统工程师,Verve

现代基础设施的制胜组合

通过将GKE计算类的技术弹性与计算Flex CUD的折扣适应性配对,您可以创建一个强大且经济合理的硬件采用策略,如新一代Compute Engine机器规格。这种集成方法使您能够:

  • 安全创新:逐步引入和测试新机器系列与您的关键工作负载。
  • 优化性能和成本:利用Google Cloud提供的最新且最具成本效益的硬件。
  • 增强弹性:即使在集成新硬件时也能确保应用的高可用性。
  • 简化操作:让GKE管理跨不同机器类型的节点配置和扩展的复杂性。

利用这些能力保持在创新的前沿,并自信地探索和利用Google Cloud快速发展的计算环境的好处——安全、高效且成本效益高。

要了解更多,此视频提供了关于自定义计算类如何改进GKE中基础设施自动扩展的有用概述。然后,立即探索Compute Engine的第四代机器类型、GKE计算类和计算灵活CUD!

致谢:我们要感谢Google Compute Engine的高级产品经理Yasmin Mowafy对本文的贡献。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计