结合Veo与实景电影制作的技术实践
某机构DeepMind团队与Primordial Soup合作推出短片《ANCESTRA》,该作品在Tribeca电影节首映,首次实现了生成式AI视频模型Veo与实景电影制作的深度融合。该项目动用了200多名专业人员,包括动画师、艺术指导、技术专家和传统电影制作团队。
先进生成模型在影视制作中的应用
创作团队使用Gemini对导演Eliza McNitt出生时的照片进行美学细节分析,生成精准的文字描述作为提示词。Imagen模型负责生成关键概念艺术图像,定义影片的整体视觉风格。Veo则通过图像动画化和文本提示控制,最终生成动态场景。
新型Veo能力的协同开发
为满足电影级制作需求,团队开发了三大新技术能力:
个性化视频生成 通过微调Imagen模型匹配参考图像风格,结合Gemini精调提示词,生成符合艺术指导的子宫内婴儿影像,并利用Veo的图像转视频功能实现动态化。
运动匹配视频生成 建立人体3D虚拟模型,通过虚拟摄像机记录运动轨迹,使用Veo的运动匹配功能生成符合特定摄像机运动的新视频。例如通过参考视频引导,生成有机孔洞闭合的序列镜头,传统CGI制作需耗时数周的技术现在仅需数分钟。
实景与生成素材的融合技术 采用Veo的"添加对象"功能,在实拍 footage 中指定区域生成婴儿影像,保持场景一致性,再通过传统VFX和色彩分级进行精修。例如鳄鱼卵内部纹理场景,通过多段生成视频与传统VFX合成技术的无缝结合实现。
赋能电影制作的新范式
该技术方案证明生成式AI可有效补充现有制作流程,帮助创作者突破实拍限制,实现高难度或高成本场景。通过与电影人的深度合作,技术团队确保工具开发切实符合专业制作需求,为未来影视技术创新提供重要实践基础。
本文涉及的技术方案包括:视频生成模型微调、运动匹配算法、多模态提示词工程、生成内容与实拍素材的时序对齐等技术细节。