專訪 Pure Storage 架構長李宏偉:加速人工智慧別讓儲存效能成為瓶頸
向來以全快閃記憶體陣列 (All-Flash Array, AFA) 儲存系統著稱的 Pure Storage,其全球技術架構長暨副總裁 (Vice President, VP) 李宏偉 (Robert Lee),正是來自台灣的數理天才,15 歲攻讀麻省理工學院 (MIT),19 歲取得電腦科學碩士學位。
「Pure Storage 的特點不僅僅是令人驚艷的效能,而是我們以使用者為中心來思考產品的功能與架構,」李宏偉說道:「面對發展人工智慧的未來,我們要持續不斷瞭解客戶的需求。」
因此李宏偉在拜訪故鄉台灣的同時,也訪問東亞包含香港、日本等多國指標性企業,瞭解他們對資訊系統與人工智慧應用的需求與看法,成為後續精進強化的意見參考。
本文目錄
以軟體架構型塑未來儲存架構
李宏偉父母均為台灣人,李宏偉在台灣就讀小學一年後即舉家遷往美國,在美國發掘其數理長才,15 歲即攻讀麻省理工學院 (MIT),19 歲取得電腦科學碩士學位。李在幼時喜歡玩樂高 (LEGO) 積木玩具,因此原先的志向是機械架構,但之後接觸電腦科學領域,發現軟體可以建構出更多東西,因而轉向電腦架構。
李宏偉在加入 Pure Storage 前是在甲骨文 (Oracle) 擔任架構師,但看到 Pure Storage 的新創活力,人人具有探索、求新的熱忱,同時也積極吸引人才、留住人才,因而在 2013 年決定加入當時僅 150 人的 Pure Storage,並為 Pure Storage 構建出 FlashBlade 的新系列儲存系統。

為人工智慧平台而生的基礎建設
FlashBlade 系列有別於 Pure Storage 本有的系列產品,原有的全快閃儲存系統是以區塊儲存、結構性資料為主,例如支援虛擬機器、資料庫等,但 FlashBlade 是針對非結構性資料而重新思考的新架構,針對檔案、物件進行最佳化設計。
進一步的,Pure Storage 與 NVIDIA 技術合作,提出了 AI-Ready Infrastructure 方案,簡稱 AIRI。AIRI 是針對人工智慧應用所設計的資訊基礎建設,將 Pure Storage 的 FlashBlade 儲存系統,與 NVIDIA 的 DGX-1 人工智慧電腦,以及 ARISTA 的網路交換器等三者整合,成為一套完整可快速運用的人工智慧系統。
李宏偉表示,NVIDIA 肯定 Pure Storage 是堅實的技術合作夥伴,當 NVIDIA 向客戶銷售人工智慧電腦時,也會同時推薦與帶入 Pure Storage。Pure Storage 的 FlashBlade 可連接 8 組 40GbE 網路,最高達 320Gbps 傳輸率,使人工智慧應用不會產生儲存效能瓶頸。
雖然 FlashBlade 具有傲人的規格數據,但李宏偉建議企業不可盡信數據,當客戶談及儲存系統的標竿效能 (Benchmark Performance) 數字時,他更傾向借給客戶 Pure Storage 的儲存系統,透過實際的概念驗證 (Proof of Concept, PoC),透過實際效能的體驗,較標竿測試數據更為可靠。
Pure Storage 台灣區總經理劉國龍也補充,國內知名流通業的資訊長在使用過 Pure Storage 後,形容使用到這樣快速的儲存系統,就如同服用嗎啡一樣,是上癮不可拔的。但是,李宏偉也提醒,系統應追求的是平衡,而非單一環節的加速,Pure Storage 從第一款產品的發展,至今都秉持這樣的信念在規劃、設計架構。
安裝手冊只需一張卡片的儲存系統
除了整體平衡通暢的效能外,Pure Storage 也重視產品的親和性與空間精省性,安裝一套 Pure Storage 儲存系統僅需要 20~25 分鐘,且絕大多數時間是在拆箱;而操作、維護管理上也簡單直覺,如同智慧手機使用應用程式市集般容易,說明手冊僅簡單數頁,而非其他儲存系統說明手冊,厚如天書,需要博士等級的 K 書能力才能消化。
在空間精省性上,以相同的應用需求而言,Pure Storage 僅需 4U 高度的機架空間便可實現,但其他業者卻需要 2 機櫃才能滿足。Pure Storage 不單是滿足效能,也在企業資料中心簡化上貢獻心力。企業資料中心的簡化效益,或許在台灣尚未深刻感受,但在歐美先進國家卻相當重視,原因是人工費用高,展望未來簡化價值將逐漸擴展延伸到其他地區。
儲存系統效能如何影響人工智慧系統的表現?
而回歸到資訊系統架構主軸,李宏偉對於近期相當熱門的人工智慧與量子運算也有其看法。在人工智慧方面,預估會走向更主動的預測運算,他舉例,紐約市擁有 7 萬多個遊民,遊民的身份資料不完全,若他們有不尋常的聚集,市警必須提前因應防備,而不是等到意外事發才調閱閉路電視 (Closed-Circuit Television, CCTV) 畫面。
另外人工智慧也會追求更高效能,根據 Gartner 的研究調查,人工智慧應用有 80% 的時間是在資料的前置處理,例如製作資料的索引、資料的標籤等。因此如何縮短人工智慧的整體需求時間也是 Pure Storage 持續的挑戰任務,且如前述,Pure Storage 的 FlashBlade 與 AIRI 方案,不僅解決儲存上的傳輸延遲 (Latency),也帶來整體傳輸率,以及在大量分析查詢下仍維持高效能。
李宏偉也認為,人工智慧目前仍處於前期階段,需求多變且快速,並逐漸生活化發展,後續的人工智慧應用將持續影響資訊系統發展,儲存系統與運算、網路間等也會持續因應調整。
至於量子運算領域,這方面日後可能有很大潛力,但量子電腦的相關配套軟體仍需要一段長時間醞釀,例如現階段即缺乏編譯器軟體(註:李宏偉的麻省理工碩士研究即為編譯器主題)。量子電腦有別於過往,需要完全不同的思考模式。
新的架構通常需要很長一段時間的發展才能普及。李宏偉舉例,Hadoop 其實與原有的資料結構方案相比 Hadoop 僅有一點點差異,但這一點點差異就需要 10 年以上的時間才使 Hadoop 獲得普及。
既談及人工智慧與量子運算,因此也讓人好奇李宏偉對智慧城市 (Smart City) 的看法,李宏偉認為智慧城市較偏向行銷話語,智慧城市在本質上應是結合多種技術而成,例如物聯網技術、視訊監控等。
台灣市場開始感受到對高速儲存系統的需求嗎?
不僅體驗台灣資訊部門的特色,Pure Storage 也關心台灣市場與台灣企業的需求。Pure Storage 台灣區總經理劉國龍表示,雖然儲存市場開始推行 NVMe(Non-Volatile Memory, NVMe) 方案,但目前國內客戶尚未出現明顯需求,需要一段推行時間,估計到年底需求將逐漸顯現。
Pure Storage 創立於 2009 年,與數十年、十數年的儲存系統業者相比屬新興業者,但 Pure Storage 並不認為老牌大廠是主要競爭對象,真正最大的對手是傳統機械式硬碟,國內多數企業仍不瞭解快閃記憶體、固態硬碟,才是業務推展上的挑戰。
劉國龍也表示,或許人們還對全快閃儲存系統抱持著高價印象,但其實 Pure Storage 的儲存方案是相當平價實惠的,例如中壢高中即是 Pure Storage 的客戶,顯示教育市場也開始廣泛接受全快閃式儲存。
最後李宏偉表示,身為 Pure Storage 的架構長,會持續積極探索、評估各種架構,同時也致力於技術夥伴間的合作,並在持續的巡訪中,交換與分享各國區的所見所得,期能解決企業的問題,與客戶共同迎向未來。