Nvidia 挑戰 ChatGPT 與 Gemini 推出自家 NVLM 1.0 大語言模型

Nvidia 釋出 NVLM 1.0 大型語言模型,挑戰 OpenAI 和 Google,提供開原碼專案支援,含多模態能力,展示在視覺、文字處理等方面的高效能,並強調其創新架構與開發潛力。

Nvidia 上周以開原碼專案釋出 NVLM 1.0 大型語言模型 (LLM) 家族,挑戰 OpenAI GPT 與 Google 。

Nvidia 上周釋出模型權重資料,承諾會再釋出訓練程式碼,讓第三方研究人員及開發商用於 AI 專案。 NVLM 1.0 家族最大的是 720 億參數的 NVLM-D-72B,具多模態能力,號稱在複雜視覺與文字處理都有絕佳效能,比起封閉模型(如 GPT-4o)也毫不遜色。

NVIDIA 的新 AI 模型分析了一個將學術摘要與完整論文進行比較的迷因,展示了其解讀視覺幽默和學術概念的能力。(來源:arxiv.org)

Nvidia 研究人員也展示該模型解讀表情符號、分析圖像與解決數學題的能力。此外,相較於其他模型經過多模態訓練後,純文字任務效能會下降,但 NVLM-D-72B 卻能維持高效能。 Nvidia 指出,在數學題和程式編碼等純文字任務上,該模型平均準確率還提升 4.3% 。

基準測試結果比較了 NVIDIA 的 NVLM-D 模型與 GPT-4 、 Claude 3.5 、 Llama 3-V 等 AI 巨頭,顯示 NVLM-D 在各種視覺和語言任務中的競爭表現。(來源:arxiv.org)

Nvidia 希望藉此加速在 AI 領域上由 OpenAI 、 Google 或 Anthropic 等新創公司獨霸的局面。由於其模型以開原專案釋出,可讓獨立研究人員及小型開發商也能開發 AI 應用。 NVLM 專案也展示了創新架構設計,包括結合不同多模處理技術的混合策略,可促進未來研究方向。當然也可能遭到有心人士濫用、誤用。

Nvidia 的加入必然為 AI 版圖投下震撼彈,這項開原碼專案另一個影響是,當 Nvidia 將 LLM 免費提供後,以 AI 模型營生的公司可能得提升自己的價值才能讓企業用戶買單。

來源:VentureBeat

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link