編輯部2008-05-162min0

巨量儲存天王:CAS

內容定址儲存(CAS)可透過儲存的資料內容而非儲存的位置找出資訊,主要的儲存方案廠商紛紛在該領域提出產品一較長短。以下是你不可不知的相關資訊。

知名會計事務所KPMG的稅務醜聞雖是舊案,不過,仍有不少值得進一步思考的空間。簡單來說,該事務所為了幫助手上有錢的客戶「節稅」,在灰色地帶髮展創意擬出不合法的節稅方案,並為客戶修飾帳目。這裡我無意將焦點放在該公司付出的45億6千萬美元罰款,或是2.5億美元的逃漏稅額。重點是因為這件案件所找出500多萬頁的文件,包括電子與紙本格式,以及各式不同的尺寸種類。各位客倌,這就是為什麼資料保存以及數位探索(Digital- Discovery)需求,目前在資料儲存市場可以獨領風騷的絕佳範例。

目前各家大廠將內容定址儲存(content-addressed storage, CAS)技術視為救命靈符,並認為該技術可以進一步管理這些查詢探索的需求。概括來說,一個CAS的系統是藉由指定的陣列位址而非實體位址或是目錄進行尋找。因為CAS裝置可以從硬體中抽取出資料,可以透過內容而非儲存的位址尋找文件。

EMC的Centera在2002年發表,可說是最早進入該市場的產品,目前也是CAS類型產品的市場領先者,這主要是因為EMC是第一個對該領域用力著墨的廠商。不過當時的市場對CAS不甚瞭解,IT人員對於Centera的訴求更是懵懵懂懂,當時所缺乏的動力,導致企業並不傾向將CAS導入其儲存網路。而EMC的Centera需要大量的軟體調整才能與系統整合,更是為人詬病。

時至今日,大大小小的競爭者包括Caringo、HP、Hitachi、IBM、Nexsan以及Sun Microsystems,無不希望在CAS這塊大餅分上一口。雖然要達到「全面檔案儲存管理系統」的目標仍有段距離,我們仍然期望各家供應商可以發掘出 CAS更多的潛力。目前有些廠商已經一腳踏入,但我們期待有更多廠商可以在未來2年內同場競技。

要怎麼做?

CAS系統包含了儲存的節點,也就是資料實際上存取的地點;還有存取的節點,也就是儲存Metadata以及資料實際位置資訊之處。當新的資料通過一個CAS裝置時,可說是雜亂無章的,儲存的方式就是原原本本將這些資料以同樣雜亂內容儲存起來,並沒有經過整理或是針對資料標寫任何的目錄表。要找資料時,就是叫出這未經整理的資料,原汁原味重現。CAS則是會對資料進行複寫,所以需要大量儲存空間。即便是一個小小的更動,資料也會和原始資料分開存放,並提供數位指紋以及不同的儲存版本。有些廠商則只保存一份拷貝,移除通常可在標準固定儲存區域找到的資料。

因為多餘的資料與Metadata處理方式,CAS是減少靜態文件的最佳方式。因為CAS最主要是用在資料保存方面。

當企業面對大量的資料儲存需求,甚至連客戶來電以及監視影檔都必須加以保存時,CAS對於追蹤資料、消除副本並提供文件管理基礎的能力頓時變得再相關不過。無庸置疑地,CAS提供了豐富的Metadata以及變動過的資料的完整特性,符合企業追蹤不同版本資料的需求,並可在不同的儲存層保持不同時限的資料。

CAS另一個可以造福企業的特點是電子郵件的儲存,每時每刻都有許多具有訴訟敏感度的文件與副本透過電子郵件穿梭於系統內。大部分的電子郵件保存系統都是由這幾家主要的CAS廠商所提供的產品。以規模來看,企業所擁有的財務文件多不勝數,而會計財務軟體的種類也是五花八門。CAS所提供的 Metadata標籤功能,正可助企業從這茫茫資料海中找出所需的文件。

還沒那麼快

這故事並不全是振奮人心的,許多CAS裝置都有明顯的缺點。舉例來說,標準化的Metadata並不存在。儲存網路產業協會SNIA正在擬定可使 XML基礎的Metadata適用於CAS上,而這些努力目前還有待完成。記得注意SNIA的進展,並問問你的廠商是否有計畫整合最終的CAS標準。除此之外,Hitachi擁有自己的內容存檔平台,Caringo即將問世的軟體並不支援追蹤及移除副本資料。

目前並沒有單一產品可稱得上是業界標準,可支援所有的Metadata管理。然而,發展的速度相當快,這些產品即將推出的最新版本值得令人拭目以待。

弔詭的文字遊戲

CAS這項技術現今正面臨弔詭的二分法世界。因為CAS技術所挑起的市場戰火正熾,但這市場一面抓緊著CAS的大旗;另一面卻想要淡化CAS的色彩。別搞錯我的意思,主要的儲存廠商的確都絞盡腦汁要將CAS及其背後的技術納入自己的產品內。不過,某些廠商卻避免使用CAS這個詞彙,選擇聚焦於以 CAS為基礎的「精密文件保存管理系統」。這也無妨,反正不用加入這個詞彙,儲存與保存文件就夠令人困惑的了。我們在意的不是這些文字遊戲,而是使用者是否真的瞭解將CAS技術加入企業文件保存策略的重要性。

首先,讓我們來檢驗主要的優點:對於必須面對法律訴訟挑戰的企業而言,許多文件都因興訟而需找出,此時,能夠追蹤找出變更過的商業資料的能力,不啻是為企業提供一個辨識方式,確保資料沒有被更動過;可以使用Metadata來找到異質資料類型,不但可將資料儲存在適當的媒介中,更可以有效率地取出所需資料;能夠移除副本的能力,則是可以節省更多磁碟空間。

變動追蹤:企業可以藉由變動追蹤的功能清楚瞭解一份文件的演進過程。在面臨法律追溯時,這是相當實用的。變動追蹤和固定內容都是由雜亂(hash)程序所創造出來。因為偏執的執法人員已經宣佈Hashing是不可靠的,當原有的演算法不可靠時,幾乎每個CAS系統都允許使用一個新的 Hashing演算法。

Harshing這個功能是CAS系統主要的效能瓶頸,但許多廠商仍致力於在非尖峰時段,以硬體發展Hashing功能或產生Hashing背景。

Metadata:當一家企業擁有豐富的Metadata環境時,要對這些多元化的資料進行搜尋、分類以及資料探勘就變得不是肉眼可以負擔的工作。可指定位址式的作業系統無法儲存保管足夠有用的Metadata。CAS則從根本之處,解決了文件保管的作業難題。

CAS強調的是其他長期文件保存的先天問題,例如儲存媒介的損壞。媒介的損壞並不單是損害實體的儲存媒介而已,它還顯露出「技術」的短暫生命週期。比方說,許多媒介可比讀取這些媒介的設備來得長壽。不論是從磁碟、磁帶或是光儲存媒介搬移資料,CAS將這件事情簡單化,消弭了大部分媒介損壞的問題。

去除副本:一份檔案只留一份副本在儲存系統內的「去除副本」功能,並不是所有CAS裝置都有的。這不是件太值得高興的事情,因為儲存效率以及成本節省是相當明確的目標。我們建議使用者若有考慮採用CAS裝置時,一定要問清楚是否有去除副本的功能。

誰需要CAS?

雖然這技術已經問世數年,但CAS相較來說還不算是相當成熟。在可預見的未來,對CAS的採用仍然限制於大型企業以及特定的垂直式組織內,包括政府、醫療單位、保險、金融業、影音業者以及學校,最簡單的原因就是因為整合的成本費用。Caringo最新的CAStor軟體產品可以在一般的儲存硬體與伺服器上執行,冀望打破目前的局面,將市場拓展到小型企業上。成果如何?有待觀察。(作/Steven J. Schuchart Jr.譯/郭婉怡)

關於我們

自1990年創刊UXmaster雜誌,1991年獲得美國LAN Magazine獨家授權中文版,2006年獲得CMP Network Computing授權,2009年合併CMP Network Magazine獨家授權中文版,2014年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、MIS、IT人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2017 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416