Arm 發表 Cortex-A320 處理器與 Ethos-U85 NPU 機器學習效能提升 10 倍

Arm發表Cortex-A320處理器與Ethos-U85 NPU,採用Armv9架構,專為邊緣AI設計,機器學習效能提升10倍。結合高效能與節能特性,支援小語言模型運算,推動異質AI發展,強化物聯網與邊緣運算能力。

過去在邊緣跑 AI 功能的選擇,向來是以微型系統的 IoT 裝置為主要載體,複雜的運算則透過網路連線交給雲端主機運算。然而,當 Edge AI 的需求規模逐漸膨脹後,專屬微型系統的 IoT 裝置平台已無法負擔小型 LLM(或稱之為 SLM)的運作需求。

因此,Arm 正式推出全球第一款採用 Armv9 架構的邊緣 AI 運算平台,以全新的 Cortex-A320 CPU 與 Ethos-U85 NPU 為核心,專為物聯網 (IoT) 應用所打造,可支援超過 10 億參數的 AI 模型,甚至可達 50 億參數的規模,象徵專用型 AI 將從雲端下放到邊緣的關鍵轉折點。

目前 AWS 、西門子、瑞薩電子等業界龍頭已宣布支援該平台,Arm 主任應用工程師林宜均表示 Cortex-A320 預計將廣泛應用於智慧工廠、智慧相機、工業自動化等領域。

Cortex-A320 + Ethos-U85 可跑 10 億參數以上的 LLM

Cortex-A320 功耗大幅降低,效能可跑 LLM-5B

相較於前代 Cortex-A35,Cortex-A320 的機器學習效能提升 10 倍,CPU 效能增加 30%,並支援最新 V9.2 架構,最重要的是相較於 Cortex-A520 處理器,其功耗降低 50%,是 Cortex-A 系列處理器中最省電的產品。

Arm 應用工程總監徐達勇表示,過去使用行動專用處理器 Cortex-M85 跑 AI 時,由於內建記憶體容量及傳輸頻寬的限制,能夠跑的 AI 參數規模有限,屬於 Endpoint AI 產品線。而 Cortex-A320 優異的功耗表現,原先使用 Cortex-M85 的客戶,可以升級到 Cortex-A320,不僅適用於 Android 等功能豐富的作業系統,還全面支援即時作業系統 (RTOS) 如 FreeRTOS 和 Zephyr 來設計終端應用,邁入 Edge AI 的產品線。

Plumerai 採用 Arm Edge AI 平台打造智慧電鈴

Arm 物聯網事業部亞太區資深經理黃晏祥表示國外有一款智慧電鈴,透過 Arm Edge AI 平台,能夠即時辨識門外人員的身分,並透過 LLM 產生適當的場景描述,例如是否有家人帶著陌生人,或是快遞送貨等場景,產生文字通知寄送給使用者。而這一切並不需要將影像資料送到雲端進行辨識,可滿足客戶對於高隱私及低延遲的要求。

黃晏祥表示:「Cortex-A320 支援更大的記憶體定址空間,為執行更大規模的 Edge AI LLM 提供可能性,搭配 Ethos-U85 NPU,支援 Transformer 演算法,相較於去年基於 Cortex-M85 的平台,新平台的機器學習效能提升 8 倍。」

Armv9.2 架構加持築起資安高牆

除此之外,黃晏祥也非常鼓勵客戶升級到 Armv9 架構,立即取得最新架構所提供的安全性,包括防止程式碼被惡意竄改的指標驗證 (PAC) 、提升執行流程安全性的分支目標識別 (BTI),以及保護記憶體免受漏洞攻擊的記憶體標籤擴充 (MTE),更支援 EL2 層級虛擬化和 BF16 資料格式,在兼顧安全性的同時,進一步提升 AI 運算效能。

林宜均表示,其實 Cortex-A320 處理器最常見的應用場景是伺服器和行動裝置,其中被採用的原因之一正是安全性,因此非常建議採用前一代 Armv8 架構產品的客戶,升級到 Armv9 架構,尤其是非常容易被當成跳板的 IoT 裝置,可考慮升級到更安全的 Cortex-A320 處理器。

Kleidi AI 加持,AI 效能大提升

ARM 將 Kleidi AI 運算庫延伸至物聯網,這是一套針對 AI 框架開發者的工具,無需額外操作即可優化基於 Arm CPU 的 AI 與 ML 工作負載。 Kleidi AI 已整合於 Llama.cpp 、 ExecuTorch 和 LiteRT(透過 XNNPACK)等框架,支援 Meta Llama 3 、 Phi-3 等模型。記者會數據顯示,在跑微軟 Tiny Stories 資料集時,Cortex-A320 搭配 Kleidi AI,可得到 70% 的效能提升。

但 Cortex-A320 搭配 Kleidi AI,跑小語言模型時,究竟能提供多快的 Token 輸出效能,Arm 目前沒有確切的測試數據,有待事後驗證。

左起為 Arm 物聯網事業部亞太區資深經理黃晏祥、 Arm 應用工程總監徐達勇、 Arm 主任應用工程師林宜均。

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link