檔案虛擬化趨勢
企業網路檔案伺服器已逐漸成為令人頭痛的管理問題,這事雖然聽來似乎像是馬後炮。不過,諸如錯綜複雜的檔案遷移提高了遭入侵的危險性,以及容易卡在儲存空間裡進退不得等,都還只是檔案儲存管理議題當中的一小部份而已。再者,它們也迫使企業需要再次評估掌控各個關鍵性儲存架構的作法。
對此,部份較高瞻遠矚的企業改以投向檔案虛擬化裝置的懷抱,學著去管理儲存空間壅塞的情況,並且在這些機器上作檔案的遷徙和搬移。然而,若想要拿檔案虛擬化裝置作為企業檔案管理機制,這可是要往前跨上好一大步,因此,造成某些企業躊躇不前?!
但是,話說回來,檔案虛擬化裝置提供了以下幾種主要特色:
.全域名稱空間(namespace),可協助在網路檔案伺服器中建立檔案索引
.提供網路檔案伺服器共享的額外附加空間
.資料搬移過程透明化
.支援多層次儲存架構
此外,它可以搭配置於網路檔案伺服器前端,且檔案擬虛化裝置能在檔案伺服器與連線用戶端之間,建立起一個抽象層。而該檔案虛擬層的作用,就是將檔案以及來自於多個網路檔案伺服器的檔案系統編目分類,並允許管理者為所有可供用戶伺服器存取的網路檔案伺服器,提供一個單一性的邏輯檔案掛載點。一旦該架構確立就位之後,網路檔案伺服器會繼續原有檔案資料和meta-data寄宿的服務,而檔案虛擬化裝置則提供更進一步的檔案管理能力。
事實上,檔案虛擬化裝置可促使企業組織更靈活地調度自家的網路檔案伺服器。打個比方:它可將散落在各檔案伺服器裡的一小丁點兒空間匯集起來,簡化了檔案伺服器與虛擬化網路檔案共享上的檔案搬遷過程。然而,這種種優點,會是取決於檔案虛擬化裝置的基本架構,這些關鍵屬性特徵便是:具高可用度的裝置,提供空間擴充和提高效能之能力,以及能夠整合各家廠商之間異質檔案虛擬化裝置的檔案索引和搜尋引擎。
一般說來,企業最初將檔案虛擬化裝置引入儲存環境,為的是要能夠更有效率的掌管所擁有的檔案伺服器。大約三年多前,一家位於加州Sunnyvale市的通訊及媒體處理器暨軟體平台的開發廠商Ubicom公司,用光了NetApp裝置上的所有空間,然而,Ubicom公司首席技術長Jim Poehlman,那時卻付不起10萬塊美金來提升該裝置的儲存空間。所以,當還有其餘的網路檔案存放裝置可供利用的時候,他需要在不中斷上線機器的情況下,將檔案以即時的方式遷移,因為離線工作所帶來的生產力減損,伴隨著服務不中斷協議的關係,會造成該公司每小時得多付一萬美元的代價。
後來,Poehlman佈署了NeoPath Network的File Director產品,此舉「無須重新對網路作任何的組態設定,同時,也不會造成任何裝置離線」,他接著又說,「而且,NeoPath Network在產品的價格上,也給予我們相當大的折扣-約1萬5000塊錢。不過,當初我們購買時,他們仍只是處在測試版本的階段。」
佛羅里達州Jacksonville市的技術安全管理師Kevin Hayes也面臨同樣的問題,他必須學會處理儲存空間壅塞的情況。Hayes目前所掌管約15台左右的微軟檔案伺服器,還具有相當多的附加空間。不過,由於尚需要改善檔案儲存效能,並且,還要再校調一小部份機器的組態,但是,其中一個Hayes無法處理的,就是在於檔案搬遷的問題。為了解決這些議題,他選用了Attune Systems的Maestro File Manager,該產品允許Hayes可以建立起一個邏輯性檔案共享入口點,作用是橫跨不同的網路檔案裝置,將虛擬化的檔案空間匯集起來。「將檔案遷移至一個虛擬檔案共享點,讓我能夠跨過所有的檔案伺服器群移動檔案,此舉也能夠增加裝置的檔案處理效能。」Hayes說。
為企業提供合法電子舉證及滲透測試服務(包含起訴資料在內)的Ibis Consulting顧問公司,也有一堆不同的要求。例如,在舉證的過程當中,位於羅德島的Providence公司,會收到一堆來自於多個用戶端所傳來的格式相異的資料,然後這些通通都得上傳到NAS裝置當中,接著,Ibis才將不同用戶資料進行揀選並分類,並搬移到各儲存層供律師檢視。
所以,Ibis Consulting顧問公司(現為Pitney Bowes公司)的策略暨市場發展部副總Shane Lennon,選擇了Acopia Networks公司的ARX6000,因為它『能夠幫忙依著多層NAS系統架構和眾多CIFS共享空間置放檔案,而不會對Ibis舉證過程產生任何瓶頸!』
檔案虛擬化架構
檔案虛擬化裝置現存有四種架構,分別是:out-of-band, out-of-band和in-band混合、in-band以及split-path。而Brocade的StorageX,是唯一專門用於out-of-band或是跳脫資料傳輸路徑的檔案虛擬化裝置。不過,它需要仰賴Windows 2000/2003的namespace伺服器的幫忙,才能在網路檔案伺服器上尋找並索引檔案,並為其建立一個全域性的namespace。
用戶端的伺服器接著會採用以下幾種方式,存取並使用StorageX的全域性namespace服務。就Windows存取伺服器來說,它找到StorageX的全域性namespace後,便會使用連同Windows作業系統在內的分散式檔案系統(DFS, Distributed File System)。另外,針對Linux和UNIX作業系統而言,StorageX會更新NIS伺服器裡頭的資訊。所以,這些扮演用戶端的伺服器們,打一開始會先透過StorageX全域namespace伺服器進行檔案存取作業,接著,該伺服器便會提供這些存取伺服器有關請求檔案的實際路徑位址。最後,存取伺服器便會依回應的訊息,直接存取網路檔案伺服器上的檔案!
此種架構,在企業要從跨多個資料中心將檔案集中檢視時,是相當有用,但是,部份管理人員可能會遭遇到StorageX在處理檔案搬移上面的問題!就以Windows存取端為例,StorageX的Replocation Manager使用的是原生內建在Windows當中的複製代理程式來移動檔案,可是,在Unix或Linux的主機上,StorageX則需要佈署並安裝特有的複製代理程式,才能在不同的網路檔案伺服器間,使用NFS協定搬移檔案。所以,這件事同樣意謂著,StorageX必須要能夠以適當安全的方式,先連結到Unix和Linux作業系統,再進行代理程式的安裝作業。不過,這個舉動可能會讓IT人員有所顧忌,原因在於他們並非真正想在管理的主機上安裝此類多餘的代理程式。
EMC公司的Rainfinity Global File Virtualization則是採行out-of-band和in-band二合一的技術。Rainfinity在檔案搜尋之初,會停留在out-of-band的模式,但是當虛擬化檔案時,便會轉移到資料路徑上。不過,這點需要勞煩管理人員在網路中先建好VLAN,如此一來,Rainfinity就可以在存取伺服器與網路檔案伺服器到虛擬化檔案之間,轉進到資料路徑上。當這麼做的時候,Rainfinity裝置會取得網路檔案伺服器的IP和DNS名稱,此舉將使該網路會重新路由資料流量-即正常導向到檔案伺服器至Rainfinity這段路徑,此時,也就是Rainfinity在檔案伺服器群之間,取得檔案位置和搬移控制權的時候。
評判EMS的Rainfinity與其他檔案虛擬化裝置不同的特色,就在於它並不需要建立屬於自己的namespace。所以,無須使用namespace就成了Midwest食品包裝公司的儲存架構師Brain Peterson主要購買的因素。Peterson採用Rainfinity,以收在公司NAS系統間檔案搬移和鞏固系統架構之效。原因是,Peterson先前已經在公司的NAS上設定namespace,若導入其他的檔案虛擬化裝置,便會更動到原先NAS上的namespace,此外,這事還會牽涉到要與近500人溝通協調相關中斷事宜。
也由於Peterson此次NAS調整作業,茲事體大,所以他需要Rainfinity在運行in-band模式的時候,保護它不致發生錯誤,以確定該企業的裝置都不會進入停工的狀態。為了防範此事發生,Brian的團隊還因此寫出了他們所謂的「紅色警戒按鈕」程式。該程式的作用是,允許維運人員很快地讓Rainfinity取得out-of-band的模式,並脫離伺服器的資料路徑,讓原先的存取伺服器端,能夠直接的存取到網路檔案伺服器上的資料。「該程式為了讓我們能夠將虛擬化裝置置入像如此重要的資料路徑上,提供了另一層的保障!」,Peterson說。
移往in-band模式
由於部份用戶會考慮到將裝置設為in-band模式,所以有些in-band模式的檔案虛擬化裝置,便會提供用戶選項,好讓他們一開始能將該裝置的組態設為out-of-band的模式。Attune System公司的Maestro File Manager產品就能夠以三種模式運作:discovery模式、native模式和extended模式。在discovery模式下,Maestro File Manager允許用戶端在其網路進行初始化的查找、分析,並回報儲存空間的使用量與可用量,而無須將該裝置置於in-band模式下。所以處在此模式下時,它會產出一份資訊報表,比方像是包含了CPU資訊,儲存空間可用量,特定網路連接埠上的檔案存取特徵和吞吐量。同時,這些報表也可讓企業了解,到底他們佈署的檔案虛擬化裝置,在經過恰當的組態設定和校調之後,實際所坐收的好處為何?
不過,另一個關鍵要點則是,當你選擇使用in-band模式時,要留心這些裝置的硬體組態設定。所以,Attune System的Maestro File Manager,和NeoPath Networks的File Director都得匹配作業系統來啟用叢集組態:windows系統所搭配採用的是Attune Systems產品,而linux系統則是配合NeoPath裝置。在這二個例子中,它們可以被設定成active-passive的容錯模式,不過,當passive模式的伺服器取得失效的active模式裝置的控制權時,最長可能會有幾近一分鐘的延遲時間。
一個具高可用度、傳輸能力以及吞吐量的企業NAS環境,可能會發現「延遲」原來是來自於in-band組態設定錯誤。不過,目前只有Acopia Network的ARX6000在其所提供的軟硬體方面解決了這些疑慮。在軟體層面,ARX6000採用了可將資料和控制流分離的split-path架構,而該架構只要先指派常常動用到的檔案作業行為,則ARX6000能有更高的傳輸速度,比方像是將檔案的讀與寫的動作指到資料路徑,而不常使用的操作則讓控制路徑來處理,譬如檔案伺服器目錄的創建與刪除動作。
ARX6000也支援active-active的容錯組態,作用是允許叢集之中的兩台機器,可以進行動態的錯誤移轉。lbis顧問公司就發現到,有了ARX6000後,檔案伺服器的可用度提升了,原因在於它協助將檔案從需要維護的網路伺服器裡,可順利遷移至其他尚在運作的檔案伺服器當中。「在我們佈署ARX6000之前,因維護作業而讓服務中斷的情況,大概需費時一天才處理完畢。」lbis顧問公司的Lennon接著說,「現在服務中斷情況,每季每週末最多持續四個小時。」
不過,多數的企業都希望能夠擁有更高傳輸速度和資料吞吐量。於是,Acopia Networks在ARX6000當中,便使用了特殊的硬體規格-ASM(Adaptive Service Modules)和NSM(Network Services Modules),NSM可加速目錄改變時的控制路徑功能,而ASM則是增快檔案讀寫操作的能力。
雖然儘管可從檔案虛擬化裝置上立刻獲取不少好處,但是,部份使用者仍舊不清楚檔案虛擬化裝置長期下來該扮演什麼樣的角色!當儲存設計師Peterson需要在公司的NAS架構下搬移檔案時,他自己只採用EMC的Rainfinity;而Jacksonville市的Hayes則期待一旦他鞏固好NAS閘道後,便可以移除掉Attune Systems的Maestro File Manager。這裡,我們列出以上這些情況,只是讓廠商了解,他們應該要持續改進,讓其檔案虛擬化裝置不要只作一次性的檔案遷移工具用。
下一步要作什麼?
要把產品的角色從檔案虛擬化/搬移引擎扭轉成「企業檔案管理系統」,廠商莫不加緊開發關鍵性功能,好讓產品無論面對到企業何種NAS架構,都能續保檔案虛擬化裝置的地位。舉例來說,檔案虛擬化裝置能夠讓企業將其檔案建立索引,並且能立即得知這些特定檔案是什麼時候被更動的?而Attune Systems最近就與Google走得相當地近,他們的合作,使得用戶端在透過自身的檔案系統時,就能對檔案作到更複雜的索引和搜尋。
不過,虛擬化檔案裝置廠商同樣也承認,用戶的儲存環境未來依舊還是百家爭鳴的情況!「在這些環境當中,我們的檔案導引器就像是一把保護傘,它允許資料在不同品牌的網路檔案伺服當中,自由地移來移去。」NeoPath Networks的營運長Ali Zadeh說。
Acopia Networks近來釋出一份大家公認的某實驗室所作成的測試報告,宣稱其產品有能力於不同的虛擬化空間創建不間斷的還原點(point-in-time)快照,而該空間中的實體檔案可同時並存於EMC Celerra NS700和NetApp FAS3050當中。此外,Acopia Networks快照可經由多台檔案伺服器,建立自我不中斷備份。
「這項快照能力,能夠跨越許多企業儲存商所建立起來的藩籬,而且,它同時也瓦解了儲存陣列的壟斷問題,這可是向前邁進一大步啊!」,一間研究型公司-Toigo Partners International LLC的執行長暨管理總務Jon Toigo接著說,「因為異質快照能力(heterogeneous snapshot)消除了對消費者的禁臠,可使得陣列產品成本降低的可能性提高!」
EMC期待用戶佈署Rainfinity,是因為會有更寬廣的選擇。目前為止,檔案遷移是Rainfinity最主要常用的功能,也許,企業也會想要以虛擬化裝置來試一下容量、檔案、階層儲存和效能管理等功能。但就EMC虛擬化行銷部門主管Jack Norris表示,檔案虛擬化裝置的真正價值,是貴於「虛擬化敦促我們更有智慧地配置並分類資料!」。
當面對到搬移檔案一事,或者將網路檔案伺服器上檔案作最佳化配置時,檔案虛擬化裝置就是企業最好的對策。然而,幾項架構上的關鍵要點,可能會縮減用戶端的選擇範圍。再者,如果IT工作涉及到集中化,高容量的NAS時,企業所選用的產品之列,從最初到最末都應該會是落在Acopia Networks的ARX6000;而部門層級或是規模稍小的IT維運,便可奢侈地在in-band和out-of-band架構下選擇其一!不過,若有將檔案虛擬化裝置運用更為長久的打算,那麼,你所選擇的東西,就應該朝向具備將檔案索引和搜尋遞送標準化的產品下手。