Amazon FSx for OpenZFS现支持直接访问Amazon S3数据(无需迁移)

亚马逊云科技宣布FSx for OpenZFS文件系统现可通过S3访问点直接访问数据,支持AI/ML工作负载与S3 API无缝集成,同时保持NFS协议访问能力,消除数据迁移需求。

技术架构突破

即日起,您可将Amazon S3访问点挂载至Amazon FSx for OpenZFS文件系统,使存储在文件系统中的数据能够通过Amazon S3标准API(如GetObject/PutObject/ListObjectsV2)进行访问。该功能具有以下核心特性:

统一数据访问层

  • 双协议支持:数据持续驻留FSx文件系统,同时支持NFS协议与S3 API并行访问
  • 权限控制:每个S3访问点可配置独立IAM策略,支持VPC网络隔离和Block Public Access
  • 无拷贝操作:消除传统ETL流程,直接对接S3生态的AI/ML服务(如Amazon Bedrock/SageMaker)

实现机制

  1. 访问点配置:通过FSx控制台/AWS CLI创建S3访问点,系统自动生成桶别名(替代传统S3桶名)
  2. 服务集成
    1
    2
    3
    4
    
    # 示例:通过S3 API读取FSx数据
    import boto3
    s3 = boto3.client('s3')
    response = s3.get_object(Bucket='fsx-access-point-alias', Key='report.pdf')
    
  3. 性能表现:首字节延迟保持在毫秒级,吞吐量取决于FSx文件系统的预配置容量

典型应用场景

  • RAG工作流:将FSx中的PDF文档直接作为Amazon Bedrock知识库源
  • 数据分析:通过Athena/Glue查询文件系统数据,无需转换为S3存储格式
  • Spark处理:开源框架可直接使用S3 API访问FSx数据集

技术参数

特性 指标
访问点数量 单个文件系统支持数百个访问点
延迟水平 与原生S3访问性能一致(毫秒级)
区域支持 覆盖北美/欧洲/亚太8个区域

注意:该功能会产生额外的S3请求计费,但免除数据迁移产生的传输费用。详细定价参见FSx for OpenZFS定价页

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计