Cosmos系列第三篇:自动化的重要性
这是四部分博客系列的第三篇,分享我们优化Cosmos托管服务平台人员、流程和技术的心得。观看此视频了解Cosmos如何结合攻击面技术和专家测试,提供持续威胁暴露管理,同时减轻安全团队负担。
第三部分:自动化的重要性
在之前的博客中,我介绍了Cosmos平台的核心架构原则以及我们如何重新定义与产品和工程团队的工作。今天,我将重点介绍我们的工程团队如何持续改进流程和基础设施。从手动流程到自动化卓越的转变,彻底改变了我们构建和部署安全功能的方式。
2023年,我们监控、发布和管理Cosmos平台的流程大部分是手动的。自那以后,我们已转向高度自动化的集成和部署流程,并改变了团队为平台编写代码的方式。
我们迅速采用了高水平的自动化来构建和部署代码。我们使用通用模板标准化了代码仓库,这使得自动化创建新代码仓库变得更加容易。我们还大量利用仓库自动化来处理拉取请求、分支合并和部署。这些自动化带来了显著改进,例如能够在一周内构建和演示新的测试框架。
编写代码也发生了变化。由于我们所有的基础设施都是代码,编写代码变得更加简化。只有我们仓库中的代码才能进入任何环境,包括定义和流程本身。随着整个(环境和平台)从我们的代码仓库自我生成,本地开发、灾难恢复、扩展以及所有其他“运行平台”流程变得更加简单和一致。例如,添加一个新的、可用的测试框架可能只需要几天时间。监控和审计不需要第三方来混合和混淆日志。当然,任何更改如果发现问题都可以立即撤销。得益于这些变化和架构改进,我们的部署速度显著提高,同时交付物的一致性和可预测性也增加了。
自动化改变了我们的工程和产品团队处理Cosmos工作的方式,提高了他们快速交付新功能和能力的能力。在我的下一篇博客《以结果为导向的批判性思维》中,我们将回顾如何通过改变解决问题的起点来进一步支持团队的速度。