技术快照
组织架构:NETINT、Supermicro与Ampere® Computing
核心问题:传统x86处理器难以满足现代直播流媒体对高密度视频处理的性能与成本需求
解决方案:
- 采用NETINT Quadra VPU + Ampere Altra Max处理器构建1U服务器
- 支持95路1080i30或195路720i30流同时转码
- 集成OpenAI Whisper实现实时AI字幕生成
关键技术特性
-
硬件加速架构
- NETINT定制ASIC芯片实现高质量视频编码
- Ampere Altra Max 96核处理器处理非硬件加速任务(如去隔行/软件解码)
- 通过FFmpeg 6.0的Arm64 NEON SIMD指令实现2.9倍去隔行加速
-
性能突破
- 相比x86方案提升20倍吞吐量
- 运营成本降低80%
- CPU利用率优化至50-60%(原系统空闲达29%)
-
软件生态
- 支持FFmpeg/GStreamer/SDK控制接口
- 通过Linux内核iommu.passthrough=1参数解决IOMMU性能瓶颈
- 使用BCC工具链进行中断延迟分析(40K中断/秒下延迟仅20μs)
系统架构深度优化
-
性能调优过程:
1 2 3 4
1. 发现FFmpeg 5.0未达性能目标 → 升级至6.0版本 2. perf工具检测到__alloc_and_insert_iova_range函数占用40倍周期 3. 通过iommu直通模式降低TLB缺失率 4. 最终实现96%目标性能
-
典型工作负载:
1 2 3
混合转码任务: 100x 576i + 100x 720i + 10x 1080i + 40x 1080p30 + 40x 720p30 + 10x 576p
行业影响
- 全球首款支持300路HD隔行频道实时处理的1U服务器
- 为CDN/直播平台提供每机架单元15kW的能效比优化方案
- 扩展支持MPEG-2等非VPU原生格式的解码能力
“Ampere处理器与NETINT VPU的结合,在1U服务器中开启了视频处理的新纪元”
——NETINT联合创始人Alex Liu