探索AI宇宙,尽在AI导航中心

Phenaki

Phenaki 是一项新技术,可以根据文本描述生成逼真的视频。它由 Google Research 开发,结合…

什么是Phenaki?


Phenaki 是视频合成领域的一项突破,因为它可以处理开放域和时变提示,这与之前受数据可用性和计算成本限制的方法不同。 Phenaki 还可以根据静态图像和提示生成视频,例如放大猫的眼睛或使其打哈欠。 Phenaki 有许多潜在的应用,例如娱乐、教育、讲故事和艺术。要了解有关 Phenaki 的更多信息,您可以阅读 Google Research 发表的论文或观看 Phenaki 在其网站或 YouTube 频道上生成的一些示例视频。

优势


它可以生成可变长度和质量的视频,最长可达两分钟 它可以处理开放域和时变提示,例如故事或描述 它利用大量图像文本对和少量视频文本概括视频数据集之外的示例

不足


训练和运行模型需要很高的计算成本和资源它可能会对某些提示或领域产生不切实际或不真实的结果它可能会引发有关生成视频的使用和所有权的道德或法律问题