谷歌推出新款輕量級語言模型 Gemma:小而強大

Gemma 模型尺寸較小,用户可以在資源有限的環境中輕鬆使用

最近更新時間 2024-02-23 21:16:39

103.jpg

谷歌即將推出兩款新的開放式大型語言模型(LLM),分別名為 Gemma 2B 和 Gemma 7B。與 Gemini 不同,這兩款模型只包含解碼器模型,被設計為“輕量級”,專注於文本生成。它們提供了開放權重、預訓練變體和指令調整變體。

谷歌表示,這些新產品非常適合文本生成任務,如回答問題和總結信息,但它們更小、更易於部署。由於 Gemma 模型尺寸較小,用户可以在資源有限的環境中輕鬆使用,包括筆記本電腦、台式機或個人雲基礎設施。

Iris.ai 的首席技術官維克多-博特夫稱讚谷歌的舉措,認為小型語言模型的能力正在迅速增長。他補充道,這將幫助許多組織克服採用人工智能的障礙。谷歌表示,Gemma 將通過“民主化獲取”人工智能模型,促進公平競爭。到 2024 年,谷歌將如何利用 Gemini 和多模態人工智能來發揮其潛力,以及它為何能夠搶佔微軟的市場先機。

小型語言模型不僅易於部署,而且對於許多使用案例來説,較少的參數數量更有效。與使用較大的模型並期望它們在多種任務中表現出色相比,較小的模型在執行核心任務時表現更為可靠。博特夫指出,實際應用比龐大的參數數量更為重要,尤其是考慮到大型語言模型的鉅額成本。

rss_feed