Meta發表次世代自製AI晶片MTIA 五月份將發布Llama 3

Meta昨日公佈自製AI晶片「Meta訓練暨推論加速器」，將用於臉書上排序及推薦顯示廣告，其製程提升至5奈米，效能是前代3倍，同時預告5月將公佈大語言模型Llama3。

繼英特爾公佈 AI 加速器 Gaudi 3 隔日，Meta 昨日公佈自製 AI 晶片的開發成果，Meta 訓練暨推論加速器 (Meta Training and Inference Accelerator, MTIA)，是去年 MTIA v1 的最新世代。這款晶片將用於在 Meta 服務如臉書上執行排序及推薦顯示廣告。

Meta 表示該公司從第一塊晶片到可以用於執行模型的時間，僅花不到九個月，比 Google TPU 還短。與 7 奈米製程生產的 MTIA v1 相較，新一代 MITA 晶片將採 5 奈米製程，體積也比較大以容納更多處理核心。 90W 的耗能大於前代的 25W，但是記憶體 (128MB vs 64MB) 和平均時脈 (1.35GHz vs 800 MHz) 也大為改進。

Meta 說，次世代 MTIA 目前已安裝在 16 個資料中心節點，宣稱效能是前一代的 3 倍之多。不過該公司並未提供詳細數字，只說是在兩平台上執行 4 個主要模型的結果。

五月將公布 Llama3

和 AI 晶片相關，Meta 高層昨天也在一場活動上預告 5 月將公佈最新一代大語言模型 (LLM) Llama 3 。

但是 Meta 的宣佈又有點啟人疑竇。首先現在 Meta 並未用最新 MTIA 來執行生成式 AI 訓練，雖然也表示目前有多項探究計畫進行中。其次，Meta 也承認次世代 MTIA 在訓練作業上並不會取代 GPU，而只是輔助角色。這顯示 Meta 可能進度落後預期。

Meta 急著在生成式 AI 領域趕上對手，執行長祖克柏今年初法說會上曾表示，AI 是今年最重點，公司將會在投資數十億美元，因此 Meta 可能面臨削減成本的壓力。該公司預期為訓練和執行 AI 模型，到今年底要在 GPU 上支出 180 億美元。和其他軟體公司如微軟、 Google 、 Amazon 、甚至 OpenAI 一樣，使用自行設計的晶片可節省許多支出。

同時間競爭者有不錯進展。 Google 本周在 Next ‘24 大會上宣佈 Google Cloud 推出第 5 代自製訓練 AI 晶片 TPU v5p 的服務，以及第一款執行 AI 模型的晶片 Axion 。 Amazon 也公佈了多款 AI 晶片計畫。微軟去年首度公佈二款自製 AI 晶片，包括 Azure Maia AI 加速器及 Azure Cobalt 100 CPU 。

來源：Techcrunch

Meta 發表次世代自製 AI 晶片 MTIA 五月份將發布 Llama 3
Generated by AI

五月將公布 Llama3

相關

previousGoogle Workspace推出AI影片製作工具－Vids 產生影片不求人

next微軟系統被駭致政府信件流出　美CISA緊急下令防範

發表迴響取消回覆

相關

五月將公布 Llama3

相關

previousGoogle Workspace推出AI影片製作工具－Vids 產生影片不求人

next微軟系統被駭致政府信件流出 美CISA緊急下令防範

發表迴響取消回覆

相關

探索更多來自 網路資訊雜誌 的內容

next微軟系統被駭致政府信件流出　美CISA緊急下令防範

探索更多來自網路資訊雜誌的內容