谷歌的 AI 视频创作工具 Veo：开启高清视频创作新时代

2024年12月8日修改

在当今科技飞速发展的时代，人工智能（AI）的应用领域不断拓展，为各个行业带来了创新和变革。谷歌公司推出的 AI 模型 Veo 便是其中的一项杰出成果，它能够根据文本提示生成高清视频，为视频创作带来了全新的可能性。

谷歌宣布推出两款面向企业的生成式 AI 模型，Veo 和 Imagen 3，它们可在谷歌的云平台 Vertex AI 上使用，为企业提供了强大的创意工具。Veo 由谷歌 DeepMind 开发，能够生成具有逼真人物和动物的视频。用户可以通过上传与文本提示相关的图像或仅输入文本来创建内容。目前，Veo 仅通过私人预览的方式向部分企业开放，它可以生成 1080p 的视频片段，时长可达 6 秒，支持每秒 24 或 30 帧。

Veo 的功能十分强大，它能够根据各种文本提示创作出丰富多彩的视频内容。例如，用户可以输入“北极光在北极天空中舞动，星星闪烁，白雪皑皑的风景”这样的提示，谷歌就能生成相应的视频。此外，Veo 还能够创造出具有特定视觉风格的场景，如风景拍摄和延时视频等，为视频创作带来了更多的创意和可能性。

然而，Veo 也并非完美无缺。目前，该模型存在一些局限性，例如物体消失和不符合实际物理规律的情况，如车辆倒退等。这些问题表明，Veo 仍需要不断改进和完善。

关于 Veo 的训练数据，谷歌表示它可能包括来自 YouTube 的内容，但这是在与内容创作者达成协议的前提下进行的。谷歌强调，他们注重使用高质量、经过精心挑选的数据，并遵守安全和保障标准。不过，像其他 AI 模型一样，Veo 也引发了关于版权和专有内容的担忧，特别是模型可能会输出与现有作品几乎相同的副本。

为了解决这些问题，谷歌采取了一系列措施。他们实施了提示级别过滤器，以管理潜在的有害输出。此外，谷歌计划在 Veo 在 Vertex AI 上普遍可用后，为其输出提供赔偿，为使用该工具的企业提供一定的保护。

谷歌正在逐步将 Veo 整合到其产品套件中。今年早些时候，Veo 被引入到谷歌实验室，9 月，该模型又被整合到 YouTube Shorts 中，使创作者能够轻松制作背景场景和简短的视频片段。

与此同时，谷歌还推出了 Imagen 3，这是谷歌最高质量的图像生成模型。它可以根据简单的文本输入生成逼真的图像，并提供高级编辑功能，如在图像中添加、删除或扩展元素。从下周开始，所有 Vertex AI 客户都将能够使用 Imagen 3。像 Cadbury、Oreo 和 Milka 等品牌已经率先在其营销策略中使用这些模型。

总的来说，谷歌的 AI 模型 Veo 和 Imagen 3 为企业提供了强大的创意工具，有望推动视频和图像创作领域的发展。然而，在使用这些技术的过程中，我们也需要关注版权、道德和社会责任等问题，以确保人工智能技术的健康发展和合理应用。随着技术的不断进步，我们相信 Veo 和 Imagen 3 将不断完善，为我们带来更多精彩的创意作品。

谷歌的 AI 视频创作工具 Veo：开启高清视频创作新时代​

谷歌的 AI 视频创作工具 Veo：开启高清视频创作新时代