首页 >  AI教程资讯 > 流畅丝滑不闪屏:谷歌发布第三款视频生成模型Lumiere:运动幅度大,生成一致性良好

流畅丝滑不闪屏:谷歌发布第三款视频生成模型Lumiere:运动幅度大,生成一致性良好

2025-04-30 15:52:18 | 来源: AICG工具箱

1月29日报道丨当地时间1月23日,谷歌研究院(Google Research)发布旗下的第三款AI视频生成模型——Lumiere。这是谷歌发布的又一款视频大模型。这次的模型演示视频质量非常高,运动幅度和一致性表现也很好。除了视频生成,该模型还支持各种视频编辑和生成控制能力,可以说是包罗万象,能力值技能点拉满。

据了解,Lumiere 是一款架构先进的创新视频模型,专门用于将文本转换为视频,这在视频合成领域是一大挑战。相比于Runway、Pika等主要竞争对手采用扩散模型不同,为了实现这一目标,谷歌采用了一种创新的【空间-时间】U-Net 架构。

这种架构与传统视频模型不同,能够一次性完成整个视频时长的生成,与传统视频模型不同。而传统模型通常是先合成关键动作节点的远程帧,然后通过时间上的超级分辨率技术来处理,生成中间过渡的补偿静态帧,这种方法难以确保视频的全局时间的连贯性与一致性。

?详细介绍:

谷歌发布今年首个AI视频全能模型Lumiere:迄今为止最强大,画质逆天,水时长第一,生成视频流畅一塌糊涂

当地时间1月24日,谷歌发布旗下第三款视频模型Lumiere,这是一款先进的模型,专门用于将文本转换为视频,谷歌采用了一种创新的[空间-时间]U-Net架构。