AI开发工具周报:Gemini API批处理模式、Amazon SageMaker AI更新等(2025年7月11日)

本周AI开发工具动态包括Gemini API新增批处理模式降低50%成本,Amazon SageMaker AI升级HyperPod与MLFlow集成,Docker Compose优化AI代理部署,以及Coder推出AI云开发环境等技术创新。

Gemini API新增批处理模式

批处理模式允许通过Gemini API提交大型任务,结果在24小时内返回,延迟处理带来50%成本降低和更高速率限制等优势。
Google在博客中表示:“批处理模式适用于数据已就绪且无需即时响应的任何任务。”

AWS宣布SageMaker AI新功能

SageMaker HyperPod(支持在数千个加速器上扩展生成式AI模型开发)更新了CLI和SDK,并新增可观察性仪表板,显示性能指标、资源利用率和集群健康状态,同时支持从Amazon SageMaker JumpStart在HyperPod上部署开放权重模型。
SageMaker AI还新增远程连接功能,允许从本地VS Code实例连接。
此外,SageMaker AI现已集成全托管MLFlow 3.0,提供简化实验跟踪、训练进度监控和模型行为深度洞察。

Anthropic提出前沿AI开发透明度框架

Anthropic呼吁建立适用于大型AI开发者的透明度框架,以确保责任与安全。
Anthropic在帖子中写道:“随着模型进步,我们拥有加速科学发现、医疗保健和经济增长的空前机会。但若无安全负责的开发,单次灾难性失败可能使进展停滞数十年。我们的透明度框架提供了实用第一步:在保持私营部门敏捷性的同时,公开安全实践可见性。”
因此,其提议框架希望应用于联邦、州或国际层面,初始版本包含六项核心原则,包括仅限大型AI开发者、系统卡和文档要求,以及随AI演进灵活调整。

Docker Compose新增构建和运行代理功能

Docker更新Compose,新增功能使开发者更易构建、部署和运行AI代理。
开发者可在compose.yaml文件中定义开放模型、代理和MCP兼容工具,并通过单一命令docker compose up启动代理栈。
Compose集成多个代理框架,包括LangGraph、Embabel、Vercel AI SDK、Spring AI、CrewAI、Google ADK和Agno。

Coder重构开发环境以优化AI代理支持

Coder宣布推出AI云开发环境(CDE),将IDE、动态策略治理和代理编排整合至单一平台。
Coder表示,当前开发基础设施为人类而非代理设计,代理有不同成功需求。“代理需要安全环境、细粒度权限、快速启动时间和完整工具链访问,同时保持治理与合规。”公司公告中写道。
Coder新CDE通过引入兼顾人类与代理的功能解决此问题,包括完全隔离环境(AI代理与开发者协同工作)、双防火墙模型(限定代理访问)以及运行管理AI代理的界面。

DigitalOcean统一AI产品至GradientAI

GradientAI作为公司所有AI产品的总称,分为三类:基础设施、平台和应用。
GradientAI基础设施包含GPU Droplets、裸金属GPU、向量数据库和优化软件等构建块;GradientAI平台包括模型集成、函数调用、RAG、外部数据和内置评估工具等代理构建与监控能力;GradientAI应用包含预构建代理。
DigitalOcean在博客中表示:“若您已使用我们的AI工具,无需更改。所有现有项目和API将继续工作。变化在于我们如何整合它们,提供更清晰组织、统一文档和反映AI平台全潜力的产品体验。”

LF分散式信任实验室新增HOPrS识别图像篡改

OpenOrigins宣布其人类导向证明系统(HOPrS)被Linux基金会分散式信任接纳为新实验室。HOPrS是开源框架,可用于判断图像是否被篡改。
它利用感知哈希和四叉树分割等技术,结合区块链技术,确定图像变更方式。
据OpenOrigins,HOPrS可识别AI生成内容,此能力在区分AI与人类生成内容愈发困难时日益重要。
LF分散式信任执行董事Daniela Barbosa表示:“HOPrS加入实验室使社区能在生成式AI时代访问和协作关键内容验证工具。”

Denodo发布DeepQuery

DeepQuery利用跨多系统、部门和格式的治理企业数据,提供基于实时信息的答案。目前处于私有预览阶段。
公司还宣布支持MCP,最新版Denodo AI SDK包含MCP服务器实现。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计