2019 雲棲大會:阿里巴巴旗下平頭哥半導體達標推出含光 800 神經網路晶片 號稱效能是 nVidia Tesla P4 的 46 倍

阿里巴巴於 2018 年宣佈成立自己的的研究院-「達摩院」,並同時宣佈成立半導體公司-「平頭哥」,目標是自主發展神經網路處理晶片。時隔正滿一年,達摩院院長張建鋒在 2019 年雲棲大會上宣佈成果,推出第一款自主設計研發的神經網路晶片-「含光 800」,強調該晶片只花了一年半的時間,就完成了從設計到晶片製造的工作。

張建鋒表示:「含光 800 NPU 不但是阿里雲自主設計硬體架構,還針對阿里巴巴生態係如零售與物流的演算法進行最佳化,因此對阿里巴巴電商平台的服務如產品搜尋、產品圖片辨識、自動標籤索引等,含光 800 NPU 可大幅度提升效能,減少處理時間。」
身為阿里巴巴集團第一款神經網路處理晶片,最令人好奇的自然是效能表現。阿里巴巴表示含光 800 NPU 採用 12nm 製程,電晶體數量高達 170 億。根據 ResNet-50 測試結果,含光 800 單晶片效能最高可達 78,563 IPS,效能功耗比至 500 IPS/W。張建鋒表示含光 800 的的運算效能,是 nVidia Tesla P4 的 46 倍。

在實際應用場景的表示上,過去淘寶每天必須要花費 1 小時針對上傳達 10 幾億張的圖片進行識別分類,透過含光 800 的運算,同樣的工作量只需要 5 分鐘即可完成。
在城市大腦專案方面,含光 800 在處理交通影像方面也提供相當大的幫助,從原有的 40 顆 GPU 可降至 4 顆含光 800,延遲也從 300ms 降到 150ms。
身兼阿里雲智能總裁的張建鋒也在大會上表示,含光 800 不但會支援阿里巴巴事業群的內部應用,同時基於含光 800 的 AI 雲端服務也在阿里雲正式上線,對外販售 AI 運算力。「我們不會直接販賣晶片,而是以算力服務的方式提供給外界。」張建鋒表示。
然而張建鋒並未揭露含光 800 NPU 的製程細節,包括為何使用 12nm 製程而非 7nm 製程,以及該晶片是自主製造生產還是外包給其他半導體公司生產,加上含光 800 NPU 並不單獨對外販售,因此外界尚未能夠更進一步瞭解含光 800 NPU 的細節與架構內容。

