我在AWS上发现数千个公开数据库的历程

我如何发现AWS上数以千计的公开数据库

在日常使用互联网的过程中，我偶然间思考：究竟有多少云数据库会因错误配置而暴露在公众面前？这个好奇心驱使我进行了一次探索。

起点：一个简单的思路

我的方法基于一个简单的原理：许多AWS资源（如ElastiCache集群、MemoryDB实例、Redshift集群和某些RDS实例）都使用可预测的域名模式。它们通常遵循这样的格式：

1

<identifier>.<node-type>.<region>.rds.amazonaws.com

如果我能生成大量可能的标识符，并对这些域名进行连接测试，就有可能找到那些配置了公开访问权限的数据库端点。

技术实施过程

我决定使用masscan这款高效的端口扫描工具。首先，我编写了一个Python脚本，用于生成成千上万个符合AWS命名惯例的潜在域名。然后，我利用masscan对这些域名在数据库常用端口（如Redis的6379端口、PostgreSQL的5432端口）上进行快速扫描。

扫描结果令人惊讶。我发现了大量开放的端口。但这只是第一步——端口开放并不意味着数据库本身是可访问或包含数据的。

验证与连接

接下来是关键步骤：验证这些端点。我使用了相应的数据库客户端工具（例如redis-cli、psql）尝试与这些开放的端口建立连接。验证脚本会尝试进行基础握手，并执行诸如INFO（对Redis）或SELECT version();（对PostgreSQL）这样的无害命令，以确认该端点确实是一个可交互的数据库服务。

验证结果证实了我的部分猜想：其中存在相当数量的数据库不仅在线，而且完全没有设置任何认证，数据可以随意读取。

发现与风险

通过这次实验，我成功地识别出了数千个公开暴露的AWS数据库实例。这些实例分布在不同的服务和区域中，其中包含从缓存到关键业务数据等各种类型的信息。

核心风险点：

配置错误：大多数情况是由于安全组（Security Group）或网络访问控制列表（NACL）配置过于宽松，允许来自任意IP（0.0.0.0/0）的访问。
默认设置：部分服务在快速启动时可能使用了允许公开访问的默认模板。
缺乏认证：许多实例甚至没有启用最基本的用户名/密码认证。

结论与建议

这次探索并非为了利用漏洞，而是为了揭示云环境中普遍存在的一类安全隐患。它清晰地表明，即使是主要云服务商提供的托管服务，如果配置不当，也可能导致严重的数据泄露。

给开发者和运维人员的关键建议：

遵循最小权限原则：安全组规则应严格限定为仅允许必要的源IP地址访问数据库端口。
始终启用认证：为所有数据库实例配置强密码或访问密钥。
定期审计配置：利用AWS的Security Hub、Config等工具或第三方解决方案，定期检查网络和安全配置。
使用私有网络：尽可能将数据库部署在私有子网（Private Subnet）中，并通过堡垒机或VPN进行访问。
进行安全意识培训：确保团队了解错误配置云资源的潜在后果。

云服务提供了强大的能力，但安全始终是我们的共同责任。正确的配置是保护数据资产的第一道，也是最重要的一道防线。