东流影视限制分级 谷歌邀马斯克联手作念AI游戏!DeepMind版Sora是个3D游戏引擎,一张图生成无穷可交互寰宇
下一代寰宇模子炸场东流影视限制分级,一张图生成无穷种种的 3D 游戏寰宇。
谷歌推出Genie 2,可反应键鼠操作,可玩、可终结。
与此前究诘比拟,Genie 2 领有恒久缅念念,即使玩家把视角转开,再回来时也可沉稳渲染寰宇中已存在的部分。
游戏寰宇中还不错有其他 AI NPC 存在,与玩家终结的脚色进行复杂交互。
这意味着任何东谈主齐不错用笔墨形容他们念念要的寰宇,遴荐最心爱的呈现相貌,然后干预这个寰宇并与之互动!
这下,千里迷《暗黑淘气神 4》的马斯克齐以为很酷,随后 DeepMind 独创东谈主Hassabis邀请他一齐作念个 AI 游戏。
关键马部长他还真答理了~
团结马斯克此前宣称,xAI 将开办一家 AI 游戏职责室,两者联手的可能性还真不低。
不外谷歌 DeepMind 搞这项究诘,可不光是为了给东谈主类玩游戏的——
AI 具身智能体,迈向 AGI 的阶梯
Genie 2 可用于覆按和评估具身智能体,通过创建丰富种种的环境,不错生成 AI 在覆按时辰没见过的评估任务。
比如通过笔墨提示,覆按智能体绽开正确的门。
谷歌示意尽管这项究诘仍处于早期阶段,在智能体和环境生成智力方面仍有大齐校正空间……
但咱们肯定 Genie 2 是处分在安全覆按具身智能体的同期,温顺完结通往通用东谈主工智能(AGI)所需的广度和通用性条款。
此前,寰宇模子究诘在很猛进程上仅限于建模一个窄小的范围,比如。
Genie 2 则完成了向生成丰富 3D 寰宇的飞跃,展示了寰宇模子的显露智力,包括对象交互、复杂的脚色动画、物理模拟,以及建模并揣摸其他智能体步履的智力。
从统一帧起程,但玩家的操作不同,不错生成不同的通顺轨迹。
这意味着不错模拟反事实体验(counterfactual experiences)用于覆按智能体,也等于从"假如其时摄取另一种看成会如何"中取得警戒。
智能体还不错在 3D 寰宇中学会与其他对象交互,如气球挨打就会爆。
完结这一切,靠的照旧是扩散模子。
Genie 2 是一种自记忆潜空间扩散模子,在大型视频数据集上覆按。
(是谁领有 Youtube 里上亿小时的游戏视频数据,我不说)
过程自编码器处理后,视频的 Lantent frames 被传递到一个大型 Transformer 能源学模子,该模子使用与大型说话模子近似的因果掩码进行覆按。
在推理时,Genie 2 不错自记忆相貌采样,对单个操作和曩昔的帧逐帧实行,使用 classifier-free guidance 来提升操作可控性。
人妻管理员此外,谷歌还线路,当今给出的视频示例齐是由为蒸馏的模子生成,以展示可能性。
蒸馏模子不错作念到及时终结,但会缩短输出质料。
One More Thing
就在 2 天前,
这个大佬们齐在押注的地点,确切要火了~
参考集会:
[ 1 ] https://x.com/elonmusk/status/1864388977866006639
[ 2 ] https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/东流影视限制分级