Nvidia发布新的生成式人工智能模型 Latte3D

一秒钟内将文本转化为 3D 物体和动物

最近更新时间 2024-03-22 10:42:41

22.jpg

Nvidia在GTC 2024大会上发布了新的生成式人工智能模型Latte3D,这可谓是ChatGPT的极端升级版。Latte3D能够将简单、简短的文本提示转化为3D物体和动物,在一秒钟内完成。与旧版本相比,Latte3D的运行速度更快,就像一台虚拟3D打印机,能够为各行各业的创作者提供便利。

Latte3D的设计目标是简化各种类型创作者的3D模型创建过程,包括视频游戏、设计项目、市场营销甚至机器学习和机器人训练等领域的创作者。在Nvidia的演示中,Latte3D显示出极高的简易程度。通过简短的文本提示,人工智能就可以生成一个3D模型,并在稍后完成更多细节的处理。虽然其最终结果不如OpenAI的Sora那么逼真,但这不是Latte3D的主要目的——它旨在加速创建资产的过程,而不是从头开始构建资产。

Latte3D能够生成多个不同的选项供用户选择,Nvidia表示这些形状可以在几分钟内优化到更高的质量水平。然后,这些设计可以导出到不同的平台,如Nvidia的Omniverse,并可以进行调整,以符合所需的最终效果。Nvidia利用其Ada A100张量核心GPU对Latte3D进行了训练,并通过ChatGPT提示为训练提供支持,使其准备好与真实用户互动。

目前,Latte3D只能生成物体和动物,但在分辨不同动物、纹理和物体类型方面表现出色。Nvidia展示了这些功能,并展示了一些物体,如一只羊角编织的普通仙鹤或一只折纸的斯芬克斯猫。通过学习,该模型能够识别不同的物种,因此可以区分意大利灰狗和柴犬。

Nvidia公司的人工智能研究副总裁Sanja Fidler表示,Latte3D的速度比其前身快了很多:“一年前,人工智能模型生成这种质量的3D视觉效果需要一个小时,而目前的技术水平大约是10到12秒。我们现在生成结果的速度快了一个数量级。”

rss_feed