Sora官方文档(中文版)
Sora官方文档(中文版)
2024年2月19日修改
作为世界模拟器的视频生成模型
我们探索视频数据生成模型的大规模训练。具体来说,我们在可变持续时间、分辨率和宽高比的视频和图像上联合训练文本条件扩散模型。我们利用对视频和图像潜在代码的时空补丁进行操作的变压器架构。我们最大的模型 Sora 能够生成一分钟的高保真视频。我们的结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。
加载失败,
';if(document.write(e),!window.loadFullI18n){var o=window.i18nStorage.getItem("docx");if(!window.loadDocxCacheI18nFg||!o){var a='';document.write(a)}}}}(),delete window._initLangSettings},window._initLangSettings()}();
加载失败,