视频生成技术迎来新突破,支持文本转视频
某机构近日宣布,其聊天机器人即将获得AI驱动的视频生成能力,可直接在应用中根据文本提示生成带声音的视频。这项即将推出的功能被命名为“Imagine”,使用户能够从文本提示生成静态图像和动态视频,并将现有图像转换为视频内容。
目前,Imagine功能的访问权限似乎仅限于部分员工和选定的影响者。官方账户发表声明确认了分阶段推出的计划:“视频生成功能将通过Imagine功能推出,由Aurora驱动。可通过文本提示创建带声音的即时视频。下载独立应用,订阅高级服务,并加入等待列表以在10月获得早期访问权限。”这表明采用了分层访问系统,预计在不久的将来会更广泛地可用。
访问Imagine功能需要高级订阅层级。早期访问所需的高级服务月费为30美元。这种订阅模式表明某机构有意通过先进的AI视频生成能力实现盈利。
在正式宣布之前,某机构负责人曾暗示这一即将推出的功能,调侃称“以AI形式重新推出短视频平台”。这一声明指的是曾经流行的短视频社交媒体平台,该平台以短视频内容著称,于2017年被另一平台关闭。这一参考表明,AI生成的视频可能注重简洁性和可分享性。
某机构员工进一步澄清了与短视频平台的关联,指出生成的视频长度限制为6秒,这与该平台定义的视频时长一致。这一限制指向了一种以创建简洁、易于消化的视频内容为中心的设计理念。
根据某机构员工和获得早期访问权限的用户分享的材料,Imagine功能通过文本提示界面操作。用户输入所需视频内容的描述,应用随后生成反映这些描述的多个视频选项。用户可以从生成的结果中选择偏好的视频。
该功能能力的说明示例已在网上传播。一名员工展示了一个AI生成的视频,描绘了一只猫在穿越太空时发出呼噜声。另一个示例展示了一名宇航员在外星景观中导航。这些示例突出了Imagine功能的潜在创意应用。
除了常规应用外,一名员工表示Imagine功能内存在更 provocative 的可能性。某人在X上表示,“该功能有一个特殊模式,可以生成裸露内容。”该员工进一步阐述,该技术能够生成逼真的人体形态,可能导致 explicit 内容的创建。
在Imagine功能发布之前,该聊天机器人已经因其AI“伴侣”而受到审查。这些设计用于通过文本和语音与用户交互的AI角色因表现出粗俗和性 explicit 行为而受到批评。名为“Valentine”的新伴侣的加入进一步加剧了这些担忧。
某机构正在大力投资计算基础设施以支持其AI开发工作。该公司正在其位于某地的超级计算机上增加11万个图形处理单元(GPU)。这些专用电路旨在加速计算机图形的生成,促进更复杂AI模型的开发。