Nvidia推新AI模型Mistral-NeMo 可在桌機上RTX GPU執行

Nvidia與Mistral AI推出桌機AI模型Mistral-NeMo，提供企業高效能AI功能，強調隱私、低延遲及成本效益。

Nvidia 與法國新創業者 Mistral AI 本周聯合宣佈一款可在桌機上執行的 AI 模型，名為 Mistral-NeMo，將把 AI 功能帶進企業用戶環境。

Mistral-NeMo 參數量達 120 億，具有 context windows 達 128K token，定位提供給一般不想花費或沒有資源部署雲端 AI 的企業。 Nvidia 表示該模型親民而不失高效能，透過這款模型的開放原始碼，可促進 AI 功能的普及。

這呼應了 AI 界的發展，現在愈來愈多企業想在本地硬體上執行 AI 模型，理由是隱私、低延遲以及降低成本考量。 Nvidia 設定的是在本地筆電或桌機，而非智慧型手機上的使用情境。 Nvidia 強調，Mistral-NeMo 容易執行，在家中使用電腦就可以操作，例如一台具備 Nvidia RTX GPU 的電腦就可以跑這模型。

Mistral-NeMo 128K token context window 是很值得一提的功能，讓模型能處理和理解大量文字的能力優於競爭者。而這對必須處理長篇文件、複雜分析或難解的程式工作的企業來說由於重要。這省去了頻繁刷新 context 的必要，使輸出更具前後一致性。離線操作的好處則滿足講求資料隱私，以及網路頻寬受限的用戶需求。此外，降低模型執行的硬體需求，也可讓過去可望不可及的 AI 模型，得以更加普及化而為資源、預算有限中小型企業使用。

不過是否真能促進 AI 的「民主化」關鍵還是在是有足夠的 AI 應用。

這模型已經在 Apache 2.0 授權下公開。目前 Mistral-NeMo 已在 Nvidia NIM 推論微服務上提供，再不久會推出可下載版本。

Mistral-NeMo 也是近來公佈的最新可在桌機或智慧型手機上執行的小語言模型。在此之前，蘋果公佈了 OpenELM 、微軟有 Phi-3 家族、 Meta 推出 MobileLLM 、 Google 提供 Gemma 。就在昨日，OpenAI 也公佈了 GPT-4o mini，沒有公佈參數量，大約是和 Anthropic Claude Huai 、 Google Gemini Flash 同樣規模。

來源: VentureBeat

Nvidia 推新 AI 模型 Mistral-NeMo 可在桌機上 RTX GPU 執行

相關

previousDEVCORE攜全球資安培訓機構OffSec 引進原廠講師實體課程共育台灣資安人才

next思科修復Smart Software Manager嚴重漏洞風險度達10分極危險！

發表迴響取消回覆

相關

相關

previousDEVCORE攜全球資安培訓機構OffSec 引進原廠講師實體課程 共育台灣資安人才

next思科修復Smart Software Manager嚴重漏洞 風險度達10分極危險！

發表迴響取消回覆

相關

探索更多來自 網路資訊雜誌 的內容

previousDEVCORE攜全球資安培訓機構OffSec 引進原廠講師實體課程共育台灣資安人才

next思科修復Smart Software Manager嚴重漏洞風險度達10分極危險！

探索更多來自網路資訊雜誌的內容