Uber通过混合边缘架构优化全球网络
客户背景:Uber业务覆盖六大洲,每日处理超过100,000个并发行程和每秒超过100万次HTTP请求。
技术方案:Uber与谷歌云合作重构其全球网络架构,采用混合网络端点组替代分布式Envoy虚拟机。新架构通过具备DDoS防护的Google Cloud Armor和缓存功能的Cloud CDN,将流量从全局外部应用负载均衡器直接路由至本地基础设施。
成果效益:
- 延迟改善:第50百分位提升2.6%,第99百分位提升10%
- 成本优化:通过移除边缘Envoy虚拟机群实现显著成本节约
- 为下一代AI应用奠定高性能基础
Target基于AlloyDB AI重构智能搜索平台
客户背景:Target是美国最大零售商之一,长期引领全渠道零售体验创新。
技术方案:采用混合搜索技术结合传统关键词匹配与语义搜索,构建基于AlloyDB AI的新一代搜索平台,支持包含价格、品类等结构化约束的复杂查询。
性能提升:
- 查询执行速度提升最高达10倍
- 产品发现相关性提高20%
- 向量查询响应时间减少60%
- 系统可用性保持99.99%以上
Keeta Network基于Spanner实现高性能区块链
技术架构:构建统一多链交易的layer-1区块链,以Spanner作为分布式账本基础,利用其高可用性和弹性扩展能力。
核心优势:
- 交易处理能力:每秒1100万笔交易
- 支持跨链交易与传统支付系统互操作
- 原生支持资产代币化和数字身份
- 为金融机构提供安全、合规的全球金融生态
HCA Healthcare利用生成式AI优化护士交接流程
解决方案:基于谷歌生成式AI基础模型开发护士交接应用,可整合分析患者信息并生成简洁明了的交接报告。
应用效果:
- 每日处理约60,000次护士交接
- 单次交接时间从40分钟显著缩短
- 应用事实准确率86%,帮助性评分90%
- 每年为护士节省总计1000万小时
德意志电信采用BigQuery DataFrames升级数据科学工作流
迁移成果:
- 从本地PySpark系统迁移至BigQuery DataFrames
- 利用Gemini AI完成95%的代码转换工作
- 整个迁移仅需1人/周工作量
- 消除性能瓶颈,提升可扩展性
Baseten实现AI推理成本效益大幅提升
技术突破:
- 基于NVIDIA Blackwell的Google Cloud A4虚拟机
- 结合动态工作负载调度器
- 高吞吐量推理成本效益提升225%
- 延迟敏感型推理成本效益提升25%
美国职业棒球大联盟通过边缘缓存提供实时数据
系统升级:
- 采用Memorystore for Valkey替代老旧数据系统
- 每日处理近100亿次请求
- 峰值期间每秒处理15,000次API请求
- 为应用、场馆屏幕和电视转播提供实时数据
Kakao基于JAX和Cloud TPU扩展AI模型
战略转型:
- 从GPU基础设施转向Cloud TPU
- 采用JAX框架优化训练工具
- 模型吞吐量立即提升2.7倍
- 开源发布Kanana模型系列(包括Kanana-MoE)