Google Cloud 在大規模計算升級中加倍投入人工智能超級計算機

人工智能超級計算機將 Google Cloud 的 TPU、GPU 及其人工智能軟件結合在了一起

最近更新時間 2024-04-10 11:31:43

38.jpg

谷歌雲宣佈了對其雲基礎設施的廣泛擴展,旨在為人工智能訓練、推理和數據處理提供多樣而強大的方法。在拉斯維加斯曼德勒海灣舉行的谷歌雲年度大會上,谷歌雲推出了一系列新進展,以幫助客户釋放人工智能模型的全部潛力,其中包括 "人工智能超級計算機"(AI Hypercomputer)架構。這個架構結合了谷歌雲的TPU、GPU以及人工智能軟件,為客户提供了廣泛的生成式人工智能培訓選項組合。

AI Hypercomputer 架構的核心支柱之一是谷歌雲的張量處理單元(TPU),這是專為神經網絡和AI加速定製的電路。谷歌雲宣佈最新迭代的TPU v5p 已全面上市。該產品於去年12月首次發佈,谷歌雲聲稱其訓練大型語言模型的速度是上一代產品的三倍。每個TPU v5p 包含 8960 個芯片,每個芯片的內存帶寬可提高300%。

谷歌雲還加入了新的A3巨型虛擬機,該虛擬機將配備Nvidia的H100 GPU陣列,在每個虛擬機中提供了兩倍的GPU到GPU網絡帶寬。此外,一項名為 "Hyperdisk ML "的新服務將幫助企業利用塊存儲來改進數據訪問,以實現人工智能和機器學習(ML)的目的。Hyperdisk ML 能夠在必要時跨服務器緩存數據,以進行數千次推理,並且比其他解決方案加載模型的速度快12倍。

谷歌雲還發布了一款面向數據中心的通用CPU,名為Google Axion。這是谷歌雲首款基於Arm架構的CPU,用於為谷歌服務如BigTable、BigQuery和谷歌地球引擎提供動力。谷歌雲表示,Axion的性能比當前一代x86實例提高了50%,比基於Arm的實例提高了30%。

rss_feed