Nvidia發佈新的生成式人工智能模型 Latte3D

一秒鐘內將文本轉化為 3D 物體和動物

最近更新時間 2024-03-22 10:42:41

22.jpg

Nvidia在GTC 2024大會上發佈了新的生成式人工智能模型Latte3D,這可謂是ChatGPT的極端升級版。Latte3D能夠將簡單、簡短的文本提示轉化為3D物體和動物,在一秒鐘內完成。與舊版本相比,Latte3D的運行速度更快,就像一臺虛擬3D打印機,能夠為各行各業的創作者提供便利。

Latte3D的設計目標是簡化各種類型創作者的3D模型創建過程,包括視頻遊戲、設計項目、市場營銷甚至機器學習和機器人訓練等領域的創作者。在Nvidia的演示中,Latte3D顯示出極高的簡易程度。通過簡短的文本提示,人工智能就可以生成一個3D模型,並在稍後完成更多細節的處理。雖然其最終結果不如OpenAI的Sora那麼逼真,但這不是Latte3D的主要目的——它旨在加速創建資產的過程,而不是從頭開始構建資產。

Latte3D能夠生成多個不同的選項供用戶選擇,Nvidia表示這些形狀可以在幾分鐘內優化到更高的質量水平。然後,這些設計可以導出到不同的平臺,如Nvidia的Omniverse,並可以進行調整,以符合所需的最終效果。Nvidia利用其Ada A100張量核心GPU對Latte3D進行了訓練,並通過ChatGPT提示為訓練提供支持,使其準備好與真實用戶互動。

目前,Latte3D只能生成物體和動物,但在分辨不同動物、紋理和物體類型方面表現出色。Nvidia展示了這些功能,並展示了一些物體,如一隻羊角編織的普通仙鶴或一隻摺紙的斯芬克斯貓。通過學習,該模型能夠識別不同的物種,因此可以區分意大利灰狗和柴犬。

Nvidia公司的人工智能研究副總裁Sanja Fidler表示,Latte3D的速度比其前身快了很多:“一年前,人工智能模型生成這種質量的3D視覺效果需要一個小時,而目前的技術水平大約是10到12秒。我們現在生成結果的速度快了一個數量級。”

rss_feed