Google引入了Genie 3神经剂,可以根据简单的文本或图像说明实时创建交互式数字环境。新型号提供高清分辨率视频(720p,24张 / s)。 Genie 3中最重要的进步之一是扩展记忆的可能性。如果先前的Genie 2版本能够仅将生成环境的视觉完整性保留10秒钟,则在Genie 3中,图将达到几分钟。这意味着在离开视野后,环境的设施和地点并没有“丢失”,但可以维持,并且可以返回它们。
Genie 3允许您通过文本命令在当前模式下修改环境。用户可以添加新对象,更改天气,创建角色等等。
尽管取得了进展,但该模型仍然无法从现实世界中复制环境,而人们的运动和文本的复制有时是不准确的。
Genie 3目前正处于封闭状态,只有数量有限的研究人员可用。