耐能智慧新 AI 晶片「KL730」為何能跟 Intel、NVIDIA 競爭?
耐能智慧 15 日宣布推出搭載台積電 12 奈米製程的「KL730」輕量可擴展 AI 晶片,現已整合車規級神經網路處理器 (NPU)、影像訊號處理器 (ISP),提升先進駕駛輔助系統 (ADAS) 可無縫接入圖像、影片、聲音、奈米波等數位訊號。
耐能走出 GPU、CPU 市場區隔,提升 AI 晶片效能攻入三大場景應用
「CPU 由美國人定義,GPU 則是 NVIDIA 黃仁勳定義,但我認為接下來 AI 晶片將會是耐能來定義。」,耐能智慧(Kneron;下簡稱耐能)創辦人暨執行長劉俊成分享自家新 AI 晶片 KL730,雖然在影像處理、邏輯運算皆不如英特爾 (Intel)、輝達 (NVIDIA) 等巨頭來的強勢,但在 AI 產業應用上具備低耗能、高效能優點,並挾帶這兩項優勢攻入邊緣伺服器、智慧家居和 ADAS 三大場景應用。

相比耐能 2020 年 9 月推出的首款支援 Transformer 神經網路架構的邊緣 AI 晶片 KL720,這次新 KL730 晶片的效能提升 3 到 4 倍,且比主要產業同等產品(如 Google 張量處理器 TPU)提高了 150% 至 200%。
自生成式 AI 崛起,大型語言模型 (LLM) 運算功率提高導致需要花費大量的資金維持,劉俊成引述印度新聞媒體《Analytics India》雜誌報告指出,OpenAI 將可能因每日 70 萬美元的 ChatGPT 系統維護費,在 2024 年底面臨破產,而 KL730 安全低耗能的特性,能幫助 LLM 相關企業省下一筆可觀的電費支出。
除此之外,KL730 更擴大支援輕量級 GPT「NanoGPT」,能帶來每秒 0.35 – 4 tera 有效計算能力,滿足降低能源消耗並提升運算功率。KL730 讓使用者能在部分或完全離線下於終端運行 GPT 模型,在配合耐能的私有安全邊緣 AI 網路 KNEO,使 AI 運行在用戶的邊緣設備上,更好保障資料隱私。