Nvidia发布新的生成式人工智能模型 Latte3D

Lasted 2024-03-22 10:42:41

Nvidia在GTC 2024大会上发布了新的生成式人工智能模型Latte3D，这可谓是ChatGPT的极端升级版。Latte3D能够将简单、简短的文本提示转化为3D物体和动物，在一秒钟内完成。与旧版本相比，Latte3D的运行速度更快，就像一台虚拟3D打印机，能够为各行各业的创作者提供便利。

Latte3D的设计目标是简化各种类型创作者的3D模型创建过程，包括视频游戏、设计项目、市场营销甚至机器学习和机器人训练等领域的创作者。在Nvidia的演示中，Latte3D显示出极高的简易程度。通过简短的文本提示，人工智能就可以生成一个3D模型，并在稍后完成更多细节的处理。虽然其最终结果不如OpenAI的Sora那么逼真，但这不是Latte3D的主要目的——它旨在加速创建资产的过程，而不是从头开始构建资产。

Latte3D能够生成多个不同的选项供用户选择，Nvidia表示这些形状可以在几分钟内优化到更高的质量水平。然后，这些设计可以导出到不同的平台，如Nvidia的Omniverse，并可以进行调整，以符合所需的最终效果。Nvidia利用其Ada A100张量核心GPU对Latte3D进行了训练，并通过ChatGPT提示为训练提供支持，使其准备好与真实用户互动。

目前，Latte3D只能生成物体和动物，但在分辨不同动物、纹理和物体类型方面表现出色。Nvidia展示了这些功能，并展示了一些物体，如一只羊角编织的普通仙鹤或一只折纸的斯芬克斯猫。通过学习，该模型能够识别不同的物种，因此可以区分意大利灰狗和柴犬。

Nvidia公司的人工智能研究副总裁Sanja Fidler表示，Latte3D的速度比其前身快了很多：“一年前，人工智能模型生成这种质量的3D视觉效果需要一个小时，而目前的技术水平大约是10到12秒。我们现在生成结果的速度快了一个数量级。”