https://www.informationsecurity.com.tw/Seminar/2024_PaloAlto/
https://www.informationsecurity.com.tw/Seminar/2024_PaloAlto/

觀點

資料遷移的秘訣

2009 / 07 / 21
文 ■ Robert L. Scheier 譯 ■ Jenny
資料遷移的秘訣
資料移轉可能是複雜的、需要耗費大量時間的以及經常性發生的。以下文章說明如何簡化這個過程。

  不論在過去把資料儲存在什麼樣的儲存媒體上,現在可能是面臨搬移的時候,而且不久的將來有可能會再次搬移。對於資料為何需要搬移有許多的原因:可能舊契約是使用舊式的Fibre Channel (FC) SAN,而你要升級成新的硬體、搬遷到新的資料中心,或者是要將舊資料搬移到較便宜的儲存媒體,來滿足日益增加的資料儲存需求。

  資料遷徙(Data migration)可能是一件日常的雜事,但是這不代表它是一件簡單的事。磁碟和磁帶裝置會透過伺服器、路由器、交換器以及儲存和資料網路,而與應用程式和商業程序進行連結,更不要提存取控制政策和其他層面的安全。環境越複雜,及要轉移的資料量越多,就越不可能只用作業系統或磁碟陣列內建簡單的複製功能來完成轉移。

  轉移資料所牽涉的不單單只是拆下一個儲存櫃,然後換上一個新的這樣簡單。以下祕訣可以讓你的資料轉移更加平順。

1.了解你的對應

  在轉移任何資料到新的儲存陣列之前,必須先了解各個伺服器是如何對應到儲存媒體中,如此你才可以在新的環境中再次建立這些對應。否則,在轉移之後伺服器可能無法正確的重新啟動。

  為了避免非預期的耗損,管理者應該「了解你要移動的各個平台間的端對端真正關係。」 EMC生產與應用技術的資深主管Lou Berger說。如果你的儲存基礎架構為了容錯的關係,而是一個多重路徑的環境,那麼了解對應尤其重要,在多重路徑的環境中,當主要陣列毀壞了各個主機,會使用替代的陣列啟動。如果管理者沒有確認主機上HBAs的各個參數,確保路徑軟體的設定正確,主機將會無法正常再次啟動,他說。管理者們也需要確定在轉移後,主機會按照適當的順序探索到儲存資源。「某些應用系統和資料庫對於在探索volumes時的順序是很敏感的,」Berger說。因為一個應用系統啟動程序可能放在某一個LUN上而它的資料則放在另一個。

  管理者們甚至可能不會知道一台伺服器的存在,直到轉移後發生伺服器無法重新啟動, 「人們總是會在安裝後就忘了它們,」GlassHouse Technologies顧問服務公司首席顧問Ashish Nadkarni說。同時儲存探索和稽核工具都是有價值的,這2個工具都不能完全找出可能導致問題的錯誤組態設定,他說。

2.取得相關數據

  位於蒙特婁的電子元件配送廠商FutureElectronics Inc.的IT主管Jalil Falsafi,必須在6週內使用相對緩慢的網路頻寬,來將IBM DS4100以及DS4300入門級陣列上的資料,轉移到HP的StorageWorks XP24000陣列上。這個工作必須具備對SAN的容量,和其他像是會增加網路頻寬壓力的資料庫備份功能的深度了解。

  「你必須計算有多少LUNs或邏輯磁碟將要進行轉移。你必須知道它們的容量大小、陣列的速度、當流量頻寬吃重時可能成為熱點的交換器速度,你必須考慮的是如果發生最糟的狀況該怎麼辦。」Falsafi說。Falsafi使用FalconStor的IPStor網路儲存伺服器中內附的監視工具組,搭配主機型(host-based)和陣列型(array-based)的工具組一起取得這些數據。

  「遷徙可能會嚴重影響整體的系統效能,」LeftHand Networks的產品行銷主管Chris McCall說。「這已經成為一個相當令人厭煩的問題,通常問題會像是 『我的控制器效能是已經超載還是接近滿載?』」他警告儲存或轉移流量的資料網路超載,不是只影響被轉移資料的可用性或效能,也會影響網路中所有的資料。在遷徙之前先衡量網路頻寬的需求是一件很容易被忽略的小事,StorageIO Group的創辦人暨資深分析師的Greg Schulz說。「除非你真的很確定,不然就小心並仔細的再次檢查頻寬,否則你就會看到有多大的衝擊將會發生,」他說。當一個管理者確定該配置多少頻寬出來進行遷徙,並且在何時可取用這個頻寬的時候,可以使用像是最佳化的技術、複製最佳化和頻寬控制器這類的工具來管理這個頻寬。

3. Downtime不見得是壞事

  某些供應商宣稱它們能夠不造成應用程式任何的中斷。但是某些觀測家,像是Dimension Data公司全國服務、資料中心與儲存解決方案的主管Gary Fox,建議可以建立一些中斷時間,這是轉移資料的小技巧,可以利用這段時間來確定資料遷移的一致性。如果可能的話,他建議,在非上班時段進行轉移,「這樣你就不會有過多的壓力」有的時候壓力只會讓事情更糟。

4.注意安全漏洞

  在不同供應商的陣列間進行資料轉移時,可能會忽略權限和安全設定,造成資料有弱點可以被竊取、毀壞或濫用。就算是在檔案系統間搬移資料,舉例來說,從NTFS搬到NFS,也可能造成權限和安全設定的失效,GlassHouse Technologies的Nadkarni說。「如果你進行的搬移是從Windows到Unix或從Unix到Windows,你必須要非常的小心,因為大多數的時候使用者的權限都會完全被摧毀,」他說。

  避免安全問題最簡單的方法是使用區塊層級(block-level)的遷移來取代檔案層級。這樣的方式,遷移動作是位於「一個低於檔案系統的層級,因此主機甚至不會看出資料有任何差異」Nadkarni說。還是有可能在檔案為主的遷移中維持安全設定,他指出,如果來源和目標系統都是相同的認證和授權網域伺服器,這類的伺服器像是微軟的Active Directory。某些檔案型的遷移工具也有維護像是安全設定的智慧功能,他說。

  挖掘檔案複製工具組如何運作是很重要的,StorageIO Group的Schulz說。 「它複製了什麼?怎麼複製?只簡單的複製檔案,還是會複製檔案的其他屬性、meta data和關聯資訊?如果你的工具不會複製所有額外的權限和存取資訊,那麼就會造成很大影響。仔細閱讀文件,和服務供應商討論、去了解什麼樣的資料會被搬動,及它如何被搬動。」

5.小心謹慎地虛擬化

  主機型儲存虛擬化已經可以從一些供應商手中購得,是一種可以達成跨供應商遷移的可靠方法。Future Electronics的Falsafi表示,FalconStor所提供的主機型虛擬化軟體可以無痛遷移。「我們區隔出一個有Fibre Channel交換的XP,然後在IPStor就會多出一組硬碟組。我們在HP StorageWorks XP24000陣列上再建立一個鏡映的LUN然後進行同步化。只要主要陣列和備份的LUNs一同步,我們就會進行從主要到備份的轉換,並且將備份變成主要,」他說。

  不過不是所有的虛擬化都被製作成相同模式。某些虛擬化裝置可以被增添到管理者必要的工作中,或者會在管理者驅動程式更新的時候,造成應用系統或者用來管理儲存的volume管理器中斷,GlassHouse的Nadkarni說。他舉例說明,一個虛擬裝置可能為了辨識特定陣列而改變SCSI Inquiry String時出了問題,如果該裝置修改了inquiry string,被用來管理儲存的volume管理器就必須被重新設定去認得這個新字串,他說,不然依靠著volume的應用系統可能無法正常執行。儲存管理者們應該詢問虛擬化廠商它們的產品是否完全的透通,Nadkarni說,或是它們必須對伺服器或其他元件進行哪些變更,以免應用程式停止運作。

  Nadkarni也建議遠離那些要求能完全控制伺服器上一個陣列或整個儲存網路,以進行儲存資源虛擬化(或解虛擬化)的虛擬化裝置。某些裝置「會要求你暫時中斷以重新組態網路或是中斷整個儲存陣列來安插裝置,」他說。它們也會要求管理者「去修改主機上的設定」像是驅動程式、多重路徑軟體或volume管理器。

6. 儲存資源隨需分配

  儲存資源隨需分配可以避免所有的資料都只被儲存在同一個磁碟中,不過如果當應用程式或者使用者要求使用volume時會失效;儲存資源隨需分配也可消弭當裝置或使用者忘了歸還其要求的磁碟空間時的磁碟空間浪費。不過許多資料遷移工具不管哪些區塊已經被使用,會對目標系統的一個volume「從區塊零一直寫入到最後一個區塊」,為了能利用儲存資源隨需分配的好處,使用者必須將它安裝在來源陣列上,賽門鐵克儲存管理暨高可用性的主管Sean Derrington說。檔案系統公用套件或主機型volume 管理器在確定資料寫入之前「都有足夠的能力去辨識出某個區塊是否已經被存取過」來避免以上的問題,Nadkarni說。區塊層級遷移技術可以確保資料安全性但是卻無法進行儲存資源隨需分配,他說,「因為已寫入到整個volume中」。

7.魔鬼就在細節中

  有的時候將新與舊環境中的軟體安裝不同的修補程式時,就很容易會造成在遷移之後伺服器就失效不運作了。Nadkarni表示,在儲存陣列之間進行遷移,有的時候還需要解除安裝伺服器上舊廠商的軟體(像是驅動程式和多重路徑工具)並且在安裝新廠商的軟體。這不只會花費時間,如果有些元件沒有被移除乾淨,新舊版本的軟體還會造成伺服器的不穩定或無法運作。

8.充分了解你的儲存環境

  如果以上的秘訣有一個共同點的話,那就是儲存遷移充滿可以破壞應用程式正常運作的時間、可靠度或安全性的陷阱。「資料遷移的成功關鍵是不要對你的環境有任何不了解,」Nadkarni說。「越不了解,風險越大。」儲存管理者們通常都低估了他們對學習新儲存環境所需的時間,學習越清楚則資料遷移越容易成功。

  「任何完美無瑕的成功,你都必須事前準備並完全準備好,」Future Electronics的Falsafi說。「那代表分析、資料收集、趨勢分析。對我來說,在做任何事之前取得資訊並確實了解系統行為是很重要的。一次失敗的資料轉移所付出的代價,如商業運作中斷以及收入與信心的損失,會遠遠超過認真去了解你的來源和目標環境的時間。」

在虛擬環境中管理遷移

  伺服器虛擬化也讓資料遷移多增加了一項挑戰,就是在實體伺服器間進行虛擬機器(VMs)的遷移,而且對VMs所使用的系統映像檔和其他程式所需要的資料進行遷移時,也可能需要將這些資料轉換成虛擬環境中所使用的新格式。

  虛擬化廠商或是第三方廠商的工具組都能完成這樣的功能。VMware的Virtual Machine File System 可讓多個VMs分享叢集儲存pool的存取,並提供對虛擬主機和虛擬磁碟檔案進行即時遷移的基本功能。

  VMware的VMotion允許客戶在不中斷狀況下,可跨實體伺服器對多個VMs進行即時轉移。它也提供管理功能,像是對遷移進行優先定位的功能可確保重要的VMs維持運行,且會分配VMs所需的網路資源。VMware的Storage VMotion允許客戶在不中斷的狀況下跨陣列對VMs所使用的資料進行遷移,但這項工具會比VMotion還需要更多手動調整的設定。

  微軟在開始釋出它的Hyper-V虛擬化技術的時候並沒有提供虛擬機器的即時遷移功能,但據說這樣的功能將會出現在下一個版本。VMware最近宣佈了vStorage,包含了新設計的APIs,讓儲存供應商可以設定出更視覺化的儲存管理工具並整合進VMware的虛擬環境中,並且提供加強視覺化VMware
vCenter Server管理介面來了解VMs是如何使用儲存裝置與容量。

  VMware最近也釋出對於Storage VMotion的一些更新,像是增加從thick- provisioned裝置到thinprovisioned裝置轉移volumes的能力、將轉移資料從Raw Device Mapping (RDM) volumes 到 Virtual Machine Disk Format (VMDK) volumes的能力及將儲存管理整合進VMware vCenter Server管理介面。賽門鐵克的Backup Exec是專門的備份和復原工具,其最新版支援異質遷移及支援對VMware ESX和微軟Hyper-V環境進行資料的複製。

  HP也發展出Zero Downtime Backup及Instant Recovery 來增強針對VMware 虛擬主機的Data Protector軟體,讓客戶可以「零衝擊地備份虛擬主機上重要應用程式資料,」 HP表示。

 
遷移工具組

  遷移可以在主機上或網路中完成,也可以在區塊或檔案層級中完成,或者在陣列本身的區塊層級中完成。使用者可以從支援儲存陣列的簡單工具(通常都是只能在相同廠商的陣列中轉移資料)到開放原始碼軟體或價值數萬美金的複雜解決方案套件,排列出數百種的工具並從中挑選所需工具。

  主機型的軟體工具通常是用在不中斷下來遷移資料。某些工具只支援Windows的檔案系統,而其他的則可能在檔案或磁區層級支援多種作業系統。開放原始碼的rsync工具是主機型檔案層級的工具,它能跨越Unix系統同步檔案。許多作業系統內建就有主機型磁區層級的遷移工具,像是EMC的Rainfinity。網路型磁區層級的遷移工具包含Brocade的Data Migration Manager,一個執行在Brocade的DCX骨幹高端交換器的應用程式,根據廠商的說法,每小時的速度可高達5TM同步遷移128個 LUNs。

  相對性較少有競爭者的陣列型磁區層級的遷移工具是Hitachi Data Systems的Universal Replicator軟體,它可以在Hitachi陣列和其他的廠商間遷移資料。

  許多的供應商使用檔案系統來降低跨平台進行資料移動的複雜性。其中有Ibrix的Ibrix Fusion FileMigrator,它能增加資料分層的能力,該公司表示,允許IT管理人員去設定政策並根據使用模式來搬移資料。FileMigrator 「針對的是一個相當痛苦的點,」資料遷移的進行「是以政策為基礎來進行的背景程序」 Enterprise Strategy Group的分析師Terri cClure說。