微軟傳打造 5,000 億參數的 MAI-1 大型語言模型,與其他 AI 巨頭一決高下

微軟正開發一個名為MAI-1的大型語言模型,規模遠大於現有模型,據傳由前Google高層推動,展現微軟在AI領域的獨立創新與發展雙軌制策略。

The Information》報導,微軟可能正在打造更大的大型語言模型 MAI-1,與 Google 、 Anthropic 及 OpenAI 分庭抗禮。

這是微軟在投資 OpenAI 超過百億美元之後,首座自行開發如此規模的 LLM 。 OpenAI 的 GPT 系列不只提供 ChatGPT,也支援微軟 Copilot 。

最新傳言的 MAI-1 是由不久前跳槽微軟的前 Google 高層及 Inflection 執行長 Mustafa Suleyman 推動的成果。微軟三月以 6.5 億美元買下 Inflection 大部份員工及智慧財產,成立 AI 部門,由 Suleyman 出掌。雖然 MAI-1 可能也有前 Inflection 員工參與,但報導引述消息人士指出,MAI-1 是全新的 LLM 。

Mustafa Suleyman,1984 年 8 月出生於英國,是一位 AI 企業家。他目前是微軟 AI 的執行長,也是 DeepMind 的共同創辦人及前應用 AI 負責人,該公司後來被 Google 收購。

據傳 MAI-1 高達近 5,000 億參數,遠比微軟現有開放 LLM(如 Phi-3)來得大,其需求的運算效能及訓練資料集都大得多。報導指出,MAI-1 效能比 Meta 和 Mitral 7,000 億參數的模型更大,大約和 GPT-4 同等級,後者參數超過 1 兆。

MAI-1 的開發,顯示微軟在 AI 發展正朝雙軌制進行,一是可在行動裝置上執行的本地 AI,二是在雲端上運行的超大模型。蘋果似乎也是類似途徑。同時,這也顯示,微軟並不想完全仰賴 OpenAI,雖然其主要生成式 AI 產品,包括 Windows Copilot 都是使用 GPT 模型系列。

不過,根據消息人士指出,目前 MAI-1 的用途還不確定,包括在微軟內部也還在討論,而其使用情境也要視效能而定。為了訓練這個模型,微軟已配置了一個大型 Nvidia GPU 伺服器叢集,並匯整了多種資料源的訓練資料集,包括由 OpenAI GPT-4 生成的文字及公開網路資料。

報導指出,微軟可能在未來幾周開放預覽 MAI-1,最早時間點可能落在本月稍晚的 Build 開發者大會。

來源:Ars Technica

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link