谷歌 DeepMind 推 CAT4D:AI 魔法突破次元壁,普通视频活变 3D 大片

xxn 阅读:89207 2025-01-04 14:00:15 评论:0

IT之家最新消息称,科技界著名媒体The Decoder在前天发布了一篇文章,介绍了谷歌DeepMind与哥伦比亚大学以及加州大学圣地亚哥分校的研究人员联合开发的一款名为CAT4D的AI系统。这一系统可以将普通视频转化为动态3D场景,从而极大地降低了创作3D内容的门槛,为众多行业带来了全新的发展可能性。

CAT4D系统利用扩散模型,将单一视角拍摄的视频转换为多角度视图,进而构建成动态3D场景。用户可以从不同角度观看视频中的主体,仿佛置身其间。IT之家提供的演示图展示如下:

传统上,要实现类似效果需要多台摄像机同时录制同一场景,而CAT4D技术简化了这一流程,只需普通的视频素材即可。这一技术有望在游戏开发、电影制作和增强现实等领域带来革命性变革。

在训练AI系统的过程中,谷歌DeepMind团队发现现有数据并不充足。为解决这一问题,团队混合运用真实世界的镜头与计算机生成的内容,训练数据包括静态场景的多视角图像、单一视角视频和合成的4D数据。通过扩散模型学习,在特定时刻从特定角度创建图像。

目前,该系统生成的3D场景比原始素材要简略,但CAT4D的成像质量已经超越了同类系统。CAT4D技术具有广泛的应用前景。游戏开发者可以利用这一技术创建虚拟环境,而电影制作者和增强现实开发者也可以将其融入到自己的工作流程中。

广告声明:文中可能包含外部链接,旨在提供更多相关信息,节省查找时间,内容仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容