云原生数据库Aurora十年创新之路

本文详细介绍了云原生关系数据库Aurora的十年发展历程,包括其创新的存储与计算分离架构、服务器less技术演进,以及如何实现高吞吐量和弹性扩展的技术细节,为现代云数据库设计提供了重要参考。

云原生数据库的创新起点

2014年,某中心网络服务负责人宣布推出Aurora时提出了一个大胆但克制的定位:Aurora将是一个为云构建的关系数据库。本质上,它将MySQL的成本效益和简单性与高端商业数据库的速度和可用性相结合。在数字方面,Aurora承诺提供五倍于MySQL的吞吐量,而价格仅为商业数据库解决方案的十分之一,同时还能卸载昂贵的管理挑战并保持性能和可用性。

架构革命:计算与存储分离

Aurora于2015年正式推出,其显著特点是实现了计算与存储的解耦,这与传统数据库架构中两者紧密交织形成鲜明对比。这一根本性创新,加上自动备份和复制等其他改进,使得计算任务和存储都能轻松扩展,同时满足可靠性需求。

“Aurora的设计保留了关系数据库的核心事务一致性优势。它在存储层进行创新,创建了一个为云构建的数据库,可以在不牺牲性能的情况下支持现代工作负载,”某中心首席技术官在2019年解释道。

“为了开始解决关系数据库的局限性,我们通过将系统分解为其基本构建块来重新构架堆栈。我们认识到缓存和日志记录层已经成熟,可以进行创新。我们可以将这些层移入一个专为数据库优化的、可横向扩展、自我修复、多租户的存储服务中。当我们开始构建分布式存储系统时,Amazon Aurora就诞生了。”

在两年内,Aurora成为某中心网络服务历史上增长最快的服务。数万家客户——包括金融服务公司、游戏公司、医疗保健提供商、教育机构和初创公司——转向使用Aurora来承载其工作负载。

持续演进:迎接无服务器时代

在随后的几年中,Aurora持续演进以满足不断变化的数字环境需求。最近在2024年,某中心宣布了Aurora DSQL。这是一个重要的进步,Aurora DSQL是一种无服务器方法,专为全球规模和增强对可变工作负载的适应性而设计。

如今,国际数据公司研究估计,与其他数据库解决方案相比,使用Aurora的公司在三年内看到了434%的投资回报,运营成本降低了42%。

技术架构创新

某中心工程师认识到,云可以实现几乎无限、网络化的存储,以及独立的计算。在2017年的一篇SIGMOD论文中,Aurora研究人员描述了其架构:“高通量数据处理的核心约束已从计算和存储转移到网络。”Aurora研究人员通过“一种新颖的面向服务的架构”解决了这一约束,该架构相比传统方法提供了显著优势。

无服务器架构的突破

2018年,Aurora Serverless提供了一种按需自动扩展配置,允许客户根据需求上下调整计算容量。后续版本通过根据客户需求自动扩展进一步优化了这一过程。这种方法使客户无需明确管理数据库容量;客户只需指定最小和最大级别即可。

实现这种“高效率的资源弹性”意味着Aurora Serverless必须应对若干挑战,包括“如何定义‘热度’(即基于哪些资源使用特征进行决策)”以及如何确定是否需要采取补救措施等问题。

截至2025年5月,Aurora的所有产品现在都是无服务器的。客户不再需要选择特定的服务器类型或大小,也不必担心底层硬件或操作系统、补丁或备份;所有这些都由某中心网络服务完全管理。

实际应用案例

亚利桑那州立大学 deputy chief information officer 表示:“我们将Amazon Aurora Serverless视为我们云成熟度的下一步,帮助我们提高开发敏捷性,同时减少不常用系统的成本,进一步优化我们的整体基础设施运营。”

未来发展方向

2024年论文的作者概述了几个潜在的发展路径。这些包括“为实时迁移引入预测技术”;“利用来自互补资源需求的统计多路复用机会”;以及“使用复杂的基于机器学习/强化学习的技术进行工作负载预测和决策制定”。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计