界面新闻记者 |
界面新闻编辑 | 宋佳楠
年初发布第一代世界模型Genie后,DeepMind又在年末带着升级版新模型登场了。
美国当地时间12月4日,谷歌旗下人工智能研究机构DeepMind推出新模型Genie 2。作为Genie模型的升级版,Genie2同样是一款世界模型(AI行业对理解和模拟现实世界生成式AI模型的统称),升级后其在模拟复杂环境方面展现出更加强大的实力。
据DeepMind论文介绍,新模型最大的特色是支持通过单张图片和文字描述生成3D世界,生成时长可持续一分钟左右,但多数情况下维持在10到20秒之间。
DeepMind在论文中附带了许多段演示视频,展示用户与Genie 2的互动过程。模型会根据文字描述生成初始图片,再基于这张图片创造出一个完整的3D互动世界。用户可以通过操纵键盘鼠标与其互动,而Genie 2会实时模拟生成你看到的每一帧画面。

生成的3D世界支持用户从不同的视角互动,如第一人称视角和等距视角,以还原真实世界互动的既视感。

从演示视频中可以看出,模型生成的3D世界中的许多细节都在模拟真实世界,例如模拟物体交互、复杂角色动画、物理现象、照明效果、反射效果及NPC设计等等。

最为重要的是,这款世界模型还可以“继续成长”变得更强大。论文介绍,推出Genie 2的主要目的之一是为通用AI智能体提供无限多样的动态场景,用于训练和评估。经过循环往复的大规模训练,AI也从模拟真实世界无限接近成为一个可以理解真实世界的“智能体”。
具备以上一系列强大功能后,Genie 2模型有望在游戏领域先找到一番“用武之地”。
DeepMind团队在论文中特别指出,Genie 2能按照用户需求生成丰富多样的3D游戏环境,如果未来用于游戏开发中任务场景设计,或可彻底改变游戏行业,特别会给《我的世界》这类开放世界游戏的创作带来“一场技术革命”。
《人工智能生成合成内容标识办法》正式发布,将对行业带来哪些影响?|界面新闻 · 科技
科技早报|OpenAI正式推出AI视频生成模型Sora;英伟达涉嫌违反反垄断法,市场监管总局立案调查|界面新闻 · 科技
科技早报 | DeepSeek据悉力求提前发布R2模型;阿里云视频生成大模型万相2.1开源|界面新闻 · 科技
今日资本徐新彻底转向二级市场?行业人士:仍保留部分一级业务|界面新闻 · 科技
科大讯飞:在智能汽车领域将持续融合集成行业最新相关技术|界面新闻 · 快讯
对话招商银行俞吴杰:招行重点不在搭建通用模型,而是搭建金融行业的领域模型|界面新闻
科技早报|谷歌深夜发布最新大模型;马斯克成身家超4000亿美元“第一人”|界面新闻 · 科技
还没有评论,来说两句吧...