输入“/”快速插入内容

谷歌的 AI 视频创作工具 Veo:开启高清视频创作新时代

2024年12月8日修改
在当今科技飞速发展的时代,人工智能(AI)的应用领域不断拓展,为各个行业带来了创新和变革。谷歌公司推出的 AI 模型 Veo 便是其中的一项杰出成果,它能够根据文本提示生成高清视频,为视频创作带来了全新的可能性。
谷歌宣布推出两款面向企业的生成式 AI 模型,Veo 和 Imagen 3,它们可在谷歌的云平台 Vertex AI 上使用,为企业提供了强大的创意工具。Veo 由谷歌 DeepMind 开发,能够生成具有逼真人物和动物的视频。用户可以通过上传与文本提示相关的图像或仅输入文本来创建内容。目前,Veo 仅通过私人预览的方式向部分企业开放,它可以生成 1080p 的视频片段,时长可达 6 秒,支持每秒 24 或 30 帧。
Veo 的功能十分强大,它能够根据各种文本提示创作出丰富多彩的视频内容。例如,用户可以输入“北极光在北极天空中舞动,星星闪烁,白雪皑皑的风景”这样的提示,谷歌就能生成相应的视频。此外,Veo 还能够创造出具有特定视觉风格的场景,如风景拍摄和延时视频等,为视频创作带来了更多的创意和可能性。
然而,Veo 也并非完美无缺。目前,该模型存在一些局限性,例如物体消失和不符合实际物理规律的情况,如车辆倒退等。这些问题表明,Veo 仍需要不断改进和完善。
关于 Veo 的训练数据,谷歌表示它可能包括来自 YouTube 的内容,但这是在与内容创作者达成协议的前提下进行的。谷歌强调,他们注重使用高质量、经过精心挑选的数据,并遵守安全和保障标准。不过,像其他 AI 模型一样,Veo 也引发了关于版权和专有内容的担忧,特别是模型可能会输出与现有作品几乎相同的副本。
为了解决这些问题,谷歌采取了一系列措施。他们实施了提示级别过滤器,以管理潜在的有害输出。此外,谷歌计划在 Veo 在 Vertex AI 上普遍可用后,为其输出提供赔偿,为使用该工具的企业提供一定的保护。
谷歌正在逐步将 Veo 整合到其产品套件中。今年早些时候,Veo 被引入到谷歌实验室,9 月,该模型又被整合到 YouTube Shorts 中,使创作者能够轻松制作背景场景和简短的视频片段。
与此同时,谷歌还推出了 Imagen 3,这是谷歌最高质量的图像生成模型。它可以根据简单的文本输入生成逼真的图像,并提供高级编辑功能,如在图像中添加、删除或扩展元素。从下周开始,所有 Vertex AI 客户都将能够使用 Imagen 3。像 Cadbury、Oreo 和 Milka 等品牌已经率先在其营销策略中使用这些模型。
总的来说,谷歌的 AI 模型 Veo 和 Imagen 3 为企业提供了强大的创意工具,有望推动视频和图像创作领域的发展。然而,在使用这些技术的过程中,我们也需要关注版权、道德和社会责任等问题,以确保人工智能技术的健康发展和合理应用。随着技术的不断进步,我们相信 Veo 和 Imagen 3 将不断完善,为我们带来更多精彩的创意作品。