巨量儲存天王:CAS

內容定址儲存(CAS)可透過儲存的資料內容而非儲存的位置找出資訊,主要的儲存方案廠商紛紛在該領域提出產品一較長短。以下是你不可不知的相關資訊。

知名會計事務所 KPMG 的稅務醜聞雖是舊案,不過,仍有不少值得進一步思考的空間。簡單來說,該事務所為了幫助手上有錢的客戶「節稅」,在灰色地帶髮展創意擬出不合法的節稅方案,並為客戶修飾帳目。這裡我無意將焦點放在該公司付出的 45 億 6 千萬美元罰款,或是 2.5 億美元的逃漏稅額。重點是因為這件案件所找出 500 多萬頁的文件,包括電子與紙本格式,以及各式不同的尺寸種類。各位客倌,這就是為什麼資料保存以及數位探索 (Digital- Discovery) 需求,目前在資料儲存市場可以獨領風騷的絕佳範例。

目前各家大廠將內容定址儲存 (content-addressed storage, CAS) 技術視為救命靈符,並認為該技術可以進一步管理這些查詢探索的需求。概括來說,一個 CAS 的系統是藉由指定的陣列位址而非實體位址或是目錄進行尋找。因為 CAS 裝置可以從硬體中抽取出資料,可以透過內容而非儲存的位址尋找文件。

EMC 的 Centera 在 2002 年發表,可說是最早進入該市場的產品,目前也是 CAS 類型產品的市場領先者,這主要是因為 EMC 是第一個對該領域用力著墨的廠商。不過當時的市場對 CAS 不甚瞭解,IT 人員對於 Centera 的訴求更是懵懵懂懂,當時所缺乏的動力,導致企業並不傾向將 CAS 導入其儲存網路。而 EMC 的 Centera 需要大量的軟體調整才能與系統整合,更是為人詬病。

時至今日,大大小小的競爭者包括 Caringo 、 HP 、 Hitachi 、 IBM 、 Nexsan 以及 Sun Microsystems,無不希望在 CAS 這塊大餅分上一口。雖然要達到「全面檔案儲存管理系統」的目標仍有段距離,我們仍然期望各家供應商可以發掘出 CAS 更多的潛力。目前有些廠商已經一腳踏入,但我們期待有更多廠商可以在未來 2 年內同場競技。

要怎麼做?

CAS 系統包含了儲存的節點,也就是資料實際上存取的地點;還有存取的節點,也就是儲存 Metadata 以及資料實際位置資訊之處。當新的資料通過一個 CAS 裝置時,可說是雜亂無章的,儲存的方式就是原原本本將這些資料以同樣雜亂內容儲存起來,並沒有經過整理或是針對資料標寫任何的目錄表。要找資料時,就是叫出這未經整理的資料,原汁原味重現。 CAS 則是會對資料進行複寫,所以需要大量儲存空間。即便是一個小小的更動,資料也會和原始資料分開存放,並提供數位指紋以及不同的儲存版本。有些廠商則只保存一份拷貝,移除通常可在標準固定儲存區域找到的資料。

因為多餘的資料與 Metadata 處理方式,CAS 是減少靜態文件的最佳方式。因為 CAS 最主要是用在資料保存方面。

當企業面對大量的資料儲存需求,甚至連客戶來電以及監視影檔都必須加以保存時,CAS 對於追蹤資料、消除副本並提供文件管理基礎的能力頓時變得再相關不過。無庸置疑地,CAS 提供了豐富的 Metadata 以及變動過的資料的完整特性,符合企業追蹤不同版本資料的需求,並可在不同的儲存層保持不同時限的資料。

CAS 另一個可以造福企業的特點是電子郵件的儲存,每時每刻都有許多具有訴訟敏感度的文件與副本透過電子郵件穿梭於系統內。大部分的電子郵件保存系統都是由這幾家主要的 CAS 廠商所提供的產品。以規模來看,企業所擁有的財務文件多不勝數,而會計財務軟體的種類也是五花八門。 CAS 所提供的 Metadata 標籤功能,正可助企業從這茫茫資料海中找出所需的文件。

還沒那麼快

這故事並不全是振奮人心的,許多 CAS 裝置都有明顯的缺點。舉例來說,標準化的 Metadata 並不存在。儲存網路產業協會 SNIA 正在擬定可使 XML 基礎的 Metadata 適用於 CAS 上,而這些努力目前還有待完成。記得注意 SNIA 的進展,並問問你的廠商是否有計畫整合最終的 CAS 標準。除此之外,Hitachi 擁有自己的內容存檔平台,Caringo 即將問世的軟體並不支援追蹤及移除副本資料。

目前並沒有單一產品可稱得上是業界標準,可支援所有的 Metadata 管理。然而,發展的速度相當快,這些產品即將推出的最新版本值得令人拭目以待。

弔詭的文字遊戲

CAS 這項技術現今正面臨弔詭的二分法世界。因為 CAS 技術所挑起的市場戰火正熾,但這市場一面抓緊著 CAS 的大旗;另一面卻想要淡化 CAS 的色彩。別搞錯我的意思,主要的儲存廠商的確都絞盡腦汁要將 CAS 及其背後的技術納入自己的產品內。不過,某些廠商卻避免使用 CAS 這個詞彙,選擇聚焦於以 CAS 為基礎的「精密文件保存管理系統」。這也無妨,反正不用加入這個詞彙,儲存與保存文件就夠令人困惑的了。我們在意的不是這些文字遊戲,而是使用者是否真的瞭解將 CAS 技術加入企業文件保存策略的重要性。

首先,讓我們來檢驗主要的優點:對於必須面對法律訴訟挑戰的企業而言,許多文件都因興訟而需找出,此時,能夠追蹤找出變更過的商業資料的能力,不啻是為企業提供一個辨識方式,確保資料沒有被更動過;可以使用 Metadata 來找到異質資料類型,不但可將資料儲存在適當的媒介中,更可以有效率地取出所需資料;能夠移除副本的能力,則是可以節省更多磁碟空間。

變動追蹤:企業可以藉由變動追蹤的功能清楚瞭解一份文件的演進過程。在面臨法律追溯時,這是相當實用的。變動追蹤和固定內容都是由雜亂 (hash) 程序所創造出來。因為偏執的執法人員已經宣佈 Hashing 是不可靠的,當原有的演算法不可靠時,幾乎每個 CAS 系統都允許使用一個新的 Hashing 演算法。

Harshing 這個功能是 CAS 系統主要的效能瓶頸,但許多廠商仍致力於在非尖峰時段,以硬體發展 Hashing 功能或產生 Hashing 背景。

Metadata:當一家企業擁有豐富的 Metadata 環境時,要對這些多元化的資料進行搜尋、分類以及資料探勘就變得不是肉眼可以負擔的工作。可指定位址式的作業系統無法儲存保管足夠有用的 Metadata 。 CAS 則從根本之處,解決了文件保管的作業難題。

CAS 強調的是其他長期文件保存的先天問題,例如儲存媒介的損壞。媒介的損壞並不單是損害實體的儲存媒介而已,它還顯露出「技術」的短暫生命週期。比方說,許多媒介可比讀取這些媒介的設備來得長壽。不論是從磁碟、磁帶或是光儲存媒介搬移資料,CAS 將這件事情簡單化,消弭了大部分媒介損壞的問題。

去除副本:一份檔案只留一份副本在儲存系統內的「去除副本」功能,並不是所有 CAS 裝置都有的。這不是件太值得高興的事情,因為儲存效率以及成本節省是相當明確的目標。我們建議使用者若有考慮採用 CAS 裝置時,一定要問清楚是否有去除副本的功能。

誰需要 CAS?

雖然這技術已經問世數年,但 CAS 相較來說還不算是相當成熟。在可預見的未來,對 CAS 的採用仍然限制於大型企業以及特定的垂直式組織內,包括政府、醫療單位、保險、金融業、影音業者以及學校,最簡單的原因就是因為整合的成本費用。 Caringo 最新的 CAStor 軟體產品可以在一般的儲存硬體與伺服器上執行,冀望打破目前的局面,將市場拓展到小型企業上。成果如何?有待觀察。 (作/Steven J. Schuchart Jr.譯/郭婉怡)

發表迴響

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、 MIS 、 IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2025 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416

探索更多來自 網路資訊雜誌 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Secret Link