Astera Labs 在 Computex 2026 公布多項 AI 連接技術進展,重點包含將台灣定位為策略中心並建置雲端規模互通性實驗室、市場上最大埠數的 Scorpio X-Series 320-lane Smart Fabric Switch 正式對超大規模業者出貨,以及運用 KVCache 擴充記憶體以支援推論工作負載。
本文目錄
在台設立策略中心與雲端規模互通性實驗室
Astera Labs 台灣及亞洲業務負責人甘博隆 (Campbell) 指出,台灣已是全球 AI 基礎設施樞紐,公司因此將台灣定位為布局大規模 AI 基礎設施的策略中心,並在人力、設施、營運與工程等面向擴充在地團隊。
Astera Labs 同時宣布與四家 AI 平台供應商及五家台灣 ODM 業者合作,藉由台灣鄰近供應鏈與 ODM 的地利,在台建置雲端規模互通性實驗室 (Cloud-Scale Interoperability Lab),與合作夥伴就近完成驗證並即時解決問題。
甘博隆說明,選擇台灣作為策略中心有三項理由。第一是供應鏈源頭,直接在源頭取得零組件並與 ODM 協作,是最有效率的方式;第二是 NVIDIA 、 AMD 、 Intel 等 AI 平台業者皆在台設有龐大團隊,從新產品導入到量產多在台灣或由台灣 ODM 進行;第三是工程量能,台灣半導體供應鏈涵蓋晶圓代工、封裝、測試與驗證,Astera Labs 將擴充在台的半導體工程資源,未來也將把管理軟體的開發、測試與驗證移至台灣。
Scorpio X-Series 320-lane 交換器正式出貨並加入智慧化功能

Astera Labs 商務長 Thad Omura 宣布,Scorpio X-Series 320-lane Smart Fabric Switch 已開始對超大規模業者出貨,為市場上最大的開放記憶體語意 (Open Memory Semantic) 交換器。在 AI 機櫃中,交換器是連接所有運算資源的核心裝置,須同時兼顧效能、擴充性與可靠性三項要素。
以單一大型交換器取代過去多顆小型交換器的串接架構後,可連接更多 GPU 、減少跳接 (hops) 次數,並讓每個埠之間都維持完整吞吐量。 Thad Omura 提出的數據為 2 倍頻寬、減少 2 至 3 倍跳接,以及減少 4 至 6 倍交換器數量。 Astera Labs 同時推出涵蓋 32-lane 至 320-lane 的 PCIe 6 交換器家族(另有 160-lane 版本),全系列軟體相容並共用同一套管理架構。
在智慧化功能方面,Hypercast 針對混合專家 (Mixture of Experts) 工作負載設計,讓 GPU 只需傳送一次資料,即可由交換器以多點傳送 (multicast) 方式分派給多個 GPU 群組,加速資料分派;網路內運算 (In-Network Compute) 則將 GPU 的集合運算 (collective operations) 移至交換器處理,最高可加速 2 倍,並降低延遲、提高 GPU 使用率。
可靠性方面,Scorpio 採用硬體平面與韌體平面分離的雙平面架構,可在封包持續傳輸的同時即時更新韌體,不需整機停機;搭配 COSMOS 軟體套件,還能在訊號層級檢視連結狀態並擷取封包,快速定位資料錯誤。
以 KVCache 記憶體擴充支援推論工作負載
隨著 AI 推論工作負載對記憶體需求攀升,GPU 上的 HBM 記憶體容量逐漸不足。 Thad Omura 提出以大型 Scorpio 交換器串接大量 SSD 並接入網路,作為叢集共用的 KVCache,藉此擴充可用記憶體並加速各類推論工作負載。
此外,為因應不同 GPU 與網路技術的整合需求,Thad Omura 說明,Astera Labs 以 32-lane 與 64-lane 支援多元的前端網路裝置,所有晶片皆軟體相容並納入同一套管理堆疊,讓客戶能依應用需求選用合適的交換器並加快上市時程。
