繼英特爾公佈 AI 加速器 Gaudi 3 隔日,Meta 昨日公佈自製 AI 晶片的開發成果,Meta 訓練暨推論加速器 (Meta Training and Inference Accelerator, MTIA),是去年 MTIA v1 的最新世代。這款晶片將用於在 Meta 服務如臉書上執行排序及推薦顯示廣告。
Meta 表示該公司從第一塊晶片到可以用於執行模型的時間,僅花不到九個月,比 Google TPU 還短。與 7 奈米製程生產的 MTIA v1 相較,新一代 MITA 晶片將採 5 奈米製程,體積也比較大以容納更多處理核心。 90W 的耗能大於前代的 25W,但是記憶體 (128MB vs 64MB) 和平均時脈 (1.35GHz vs 800 MHz) 也大為改進。
Meta 說,次世代 MTIA 目前已安裝在 16 個資料中心節點,宣稱效能是前一代的 3 倍之多。不過該公司並未提供詳細數字,只說是在兩平台上執行 4 個主要模型的結果。
五月將公布 Llama3
和 AI 晶片相關,Meta 高層昨天也在一場活動上預告 5 月將公佈最新一代大語言模型 (LLM) Llama 3 。
但是 Meta 的宣佈又有點啟人疑竇。首先現在 Meta 並未用最新 MTIA 來執行生成式 AI 訓練,雖然也表示目前有多項探究計畫進行中。其次,Meta 也承認次世代 MTIA 在訓練作業上並不會取代 GPU,而只是輔助角色。這顯示 Meta 可能進度落後預期。
Meta 急著在生成式 AI 領域趕上對手,執行長祖克柏今年初法說會上曾表示,AI 是今年最重點,公司將會在投資數十億美元,因此 Meta 可能面臨削減成本的壓力。該公司預期為訓練和執行 AI 模型,到今年底要在 GPU 上支出 180 億美元。和其他軟體公司如微軟、 Google 、 Amazon 、甚至 OpenAI 一樣,使用自行設計的晶片可節省許多支出。
同時間競爭者有不錯進展。 Google 本周在 Next ‘24 大會上宣佈 Google Cloud 推出第 5 代自製訓練 AI 晶片 TPU v5p 的服務,以及第一款執行 AI 模型的晶片 Axion 。 Amazon 也公佈了多款 AI 晶片計畫。微軟去年首度公佈二款自製 AI 晶片,包括 Azure Maia AI 加速器及 Azure Cobalt 100 CPU 。
來源:Techcrunch
