IBM 開源其 Granite AI 模型

可用於研究和商業用途

最近更新時間 2024-05-14 14:03:20

36.jpg

IBM 使用來自 GitHub Code Clean、Starcoder 數據、公共代碼庫和 GitHub 問題等公開數據集的預訓練數據來開源 Granite 代碼庫。總的來說,IBM 努力避免版權或法律問題。Granite 代碼庫模型是在 3 到 4 TB 的代碼數據和與代碼相關的自然語言數據集上訓練的。所有這些模型都採用 Apache 2.0 許可,可用於研究和商業用途。正是因為“商業”這一點,其他主要的大型語言模型 (LLM) 並沒有開源。沒有公司願意分享他們的 LLM 成果。

然而,正如 IBM 研究院首席科學家魯奇爾·普里 (Ruchir Puri) 所說:“我們通過發佈性能最高、成本效益最優的代碼生成模型,改變了軟件生成式人工智能的格局,讓開放社區能夠自由創新。”雖然這些模型的使用沒有限制,但具體應用是經過深思熟慮的。正如 IBM 生態系統總經理凱特·伍利 (Kate Woolley) 去年所說,Granite 模型並不是“試圖滿足所有人的所有需求”。它不會為你的寵物寫詩。這是一個經過精心設計的模型,可以進行調整,非常針對企業的業務用例,特別是編程相關的任務。

這些純解碼器模型是在 116 種編程語言的代碼上訓練的,參數範圍從 30 億到 340 億。它們支持各種開發者的需求,從複雜的應用現代化到內存受限的設備任務。IBM 已經在內部將這些 LLM 用於 IBM Watsonx Code Assistant (WCA) 產品,例如用於 IT 自動化的 WCA for Ansible Lightspeed 和用於 COBOL 應用程序現代化的 WCA for IBM Z。雖然不是每個人都能買得起 Watsonx,但現在,任何人都可以通過 IBM 和紅帽的 InstructLab 使用 Granite LLM。

rss_feed