阿里巴巴通义实验室研发的 AI 技术 EMO(Emote Portrait Alive)通过一张照片和音频,成功使历史人物“复活”,并进行表演。在央视《2024 中国·AI 盛典》上,这项技术让兵马俑与宝石 Gem 对唱《从军行》,北宋文学家苏轼与李玉刚合唱《水调歌头》,展现了 AI 在视频生成领域的创新与应用。EMO 技术无需 3D 建模,直接从音频生成表情和唇部动作,其“弱控制设计”提升了视频生成的自然度和质量。通义实验室的这项研究不仅在学术界获得好评,也在社交媒体上引起广泛关注,预示着 AI 技术在创意领域的广阔应用前景。
Meta 的 GenAI 团队推出了 3D Gen 模型,该技术能在 60 秒内从文本直接生成高质量的 3D 资产,其纹理清晰、形态逼真,生成速度比现有技术快 3 到 60 倍。该模型特别适用于电影特效、AR/VR 和视频游戏等领域,大幅简化了 3D 内容的创作流程。3D Gen 模型通过 AssetGen 和 TextureGen 两个组件,分别负责 3D 资产和纹理的生成,有效结合了视图空间、体积空间和 UV 空间的表示,提高了生成效率和质量。尽管模型尚未开放 API 和代码,但其技术报告已公布,展示了模型的创新和潜力。