Nvidia 周二宣佈新收購及新一代開放模型,以擴大 AI 模型軟體實力。
這家晶片巨擘宣佈收購了 SchedMD,後者為開源工作負載管理系統 Slurm 供應商。 Slurm 原本是 2002 年主要開發人員 Morris Jette 和 Danny Auble 開發,後來在 2010 年他們創立了 SchedMD 。 Auble 也是 SchedMD 現任 CEO 。
Nvidia 和 SchedMD 收購金額不詳。 Nvidia 和 SchedMD 合作超過十年, Nvidia 稱 SchedMD 技術是生成式日 AI 的關鍵基礎架構。 Nvidia 也計畫持續投資 Slurm 。
而因應中國 AI 業者來勢洶洶,Nvidia 周一也宣佈了新一代 AI 模型 Nemotron 3 系列,號稱是開發準確 AI 代理人最有效率的開放模型家族。
新一代模型主打整合了 Mamba-Transformer 混合專家 (hybrid mixture-of-experts, MoE) 架構,以強化式學習 (reinforcement learning) 後訓練。 Nemotron 3 具備 100 萬 token 的脈絡長度,支援大型程式庫、超長文件、長對話以及多樣擷取內容,使模型擺脫短脈絡長度必須靠切碎、拼湊來推理,卻又反覆遺忘、前後矛盾。 Nvidia 表示 Nemortron 3 是第一次模型像人類專家一樣,在完整資料的狀態下,持續、連貫推理。
Nemotron 3 系列包含三個成員,分別是適合特定任務(如除錯、摘要重點)的 30 億參數小模型 Nemotron 3 Nano 、近 1000 億參數多代理人 AI 應用程式的 Nemotron 3 Super 以及約 5000 億參數的 Nemotron 3 Ultra,適合需要深度研究和策略規劃能力的複雜任務。現在 Nano 已經在 HuggingFace 公開。
Nvidia 執行長黃仁勳指出,開放創新是 AI 進展的基礎,憑藉 Nemotron,該公司得以將進階 AI 整合單一開放平台,賦予開發人員開發大規模代理人系統需要的透明度和効率。
Nvidia 近幾個月持續強化開原及開放 AI 技術。上個月該公司宣佈開原一款推理視覺模型 Alpamayo-R1,旨在加速自駕車研究。這款新模型在 Cosmos 世界模型中加入更多工作流程及指引,以寬鬆授權釋出,讓開發人員得以利用模型開發實體 AI 。
這些都是為了壯大 Nvidia 以 GPU 為基礎的實體 AI 基礎架構。 Nvidia 希望成為更多機器人或自駕車的整合核心基礎架構供應商。
來源:Techcrunch
