https://newera17031.activehosted.com/index.php?action=social&chash=19de10adbaa1b2ee13f77f679fa1483a.2906&nosocial=1
https://newera17031.activehosted.com/index.php?action=social&chash=19de10adbaa1b2ee13f77f679fa1483a.2906&nosocial=1

觀點

系統備援與企業營運不中斷計劃

2002 / 11 / 25
陳植混
系統備援與企業營運不中斷計劃


在知識經濟時代中,資訊與網路平台已是企業、政府及國家永續維運的命脈,有形的土地、廠房、機器設備等資產固然重要,而資訊系統中的資訊更是需小心保護的重要資產。而台灣處於地震帶,再加上颱風肆虐,如何因應天災可能為資料、資訊帶來的重大危害和損失,擬定企業營運不中斷計劃,並建立一套系統備援機制,可將損失減至最少。
資料遺失對企業影響重大
根據美國德州大學(University of Texas)2000年針對資訊安全的調查顯示,由於災難發生後,會造成企業的重要資料會隨著時間而快速流失,使得43%的公司於災難發生時無法重新營業,51%的公司則於二年內會結束營業,只有6%的公司能於災難發生後繼續生存。而National Archives and Records Administration亦表示,企業在損失營運資料後,有50%會立即倒閉;企業如損失10天以上的營運資料,93%的公司會倒閉。


而當發生不可抗拒的天災人禍時,不只會造成人民財產的重大損失、企業中斷營運,政府機關及國防軍事單位的資訊系統亦可能面臨中斷或損毀。


天災頻仍,台灣需更加強異地備援
台灣地處歐亞版塊及菲律賓版塊間,是世界上有名的地震頻繁地帶,更是「颱風」必經之地,每年面臨的災害特別的多,因此,如何安全的保護及儲存資訊資產,並在遭遇災難後能夠繼續維持正常營運,則必須要有完整的異地備援的規劃計畫,擁有異地備援機制,建立重要資料異地備備援作業計畫,並且確實落實執行,才能在災難發生後,以最快的速度、最短的時間,使資訊系統回復到正常的運作,如此,才能確保國家的安全,政府服務不打烊及企業永續經營。

系統災難造成的商業損失
系統災難造成的商業損失主要可分成以下三類:直接損失、間接損失與其它損失。說明如下:


1.直接損失:


系統災難所造成的商業直接損失可分為直接穫利損失,生產線停頓損失及出貨停頓所造成的損失等等。系統停頓所造成的直接穫利損失,如電子商務業者。電子商務業者所賴以生依的商業命脈最直接的關係莫過於系統的可靠度,當系統發生災難時對於電子商務業者的衝擊可說非常的直接。至於製造業者與通路業者,系統災難發生時最直接的損失莫過於生產線的停頓與出貨的停擺。


2.間接損失:


間接損失可大致區分為:庫存成本增加、設備折舊成本的增加、市場佔有率減少、員工閒置成本、退貨系統停擺等等。


3.其它:


舉凡未來獲利的損失、上市延遲、商譽受損及大眾信心的減少等等的因素皆可列入其它損失。


企業營運不中斷計劃
由於企業e化的程度越來越普及,企業主對於本身的營運系統也越來越依賴
與重視,故資料的保護及系統的備援重要性相對的提昇。然而資訊備援人才缺乏、需求不易規範,投資風險高,備援系統可靠性維持及完善的備援機制的建立等等的問題,仍然急需一套有效的方法去克服。


擬定企業不中斷計劃時應先從了解企業營運真正的需求開始,執行企業不中斷計劃其實就如為企業的營運買保險一樣,當企業因自然災害的發生或人為的因素造成了企業的中斷,可因企業不中斷計劃的執行而將災害影響的程度降至最低。因為執行企業不中斷計劃正如為企業的營運加買保險,所以執行者一定要相當的了解自己本身企業營運的需求,進而選擇對企業最有利的營運備援計劃或企業不中斷計劃,如此一來才能得出最具經濟效益且符合公司真正需求的營運計劃。

擬定計劃前的考量事項
以下幾點可作為企業營運資訊系統不中斷計劃所需注意的參考項目:


1.資訊系統無法運作企業所能承受的時間

當主系統因人為因素或自然災害的影響而形成主系統喪失正常操作能力,備援系統接替主系統執行運作,以目前的備援技術有非常多的做法可行,從最傳統的系統重新安裝並以磁帶回存資料的作法,甚至或以遠端即時備援系統的切換都是可行的辦法,然而正常運作的資訊系統切換至備援系統越快,意謂者企業所投入的備援金額越高。事實上、並非所有的系統皆需要備援的。如何慎選備援的機制與方法應該是資訊人員所要的課題之一。


2.資料遺失的容忍度

資料遺失(Data lost)的容忍度牽涉到企業營運的需求及備援資料的傳遞方法,現有的資料傳送不外乎有:磁帶或磁碟傳送、專線的連接或無線的傳送等等。磁帶的傳送或磁碟的傳送會有一段相當的資料遺失,比方說、資訊人員每日定時的做資料的備份,則資料的遺失大約是數小時至一天(當然不包含磁帶損害或備份不成功所造成的數天資料遺失)。若企業的資料遺失無法容忍磁碟備份所造成的資料遺失,專線或無線資料的傳送或許是另一種不錯的選擇。


不過要注意的是,當企業資料要享有資料同步備份的需求,其金錢的花費也是相當可觀的。因為必需拉光纖專線做資料的同步傳輸。若企業的資料遺失容忍度可控制於一小時?,則一般專線或許是一種較為經濟的作法。不管是資料的遺失容忍度或是系統想要回復到何種程度R.P.O.(Recovery Point Objective),應於資訊不中斷的計劃中詳加訂定。


3.主系統切換至備援系統所需的時間

主系統切換至備援系統所需的時間─R.T.O.(Recovery Time Objective)的訂定於資訊不中斷計劃中佔有相當重要的一環,因為R.T.O.關係到所有的備援經費、人員調度及企業資訊系統停擺容忍時間等等。目前一般的備援主機分成:分享式備援主機或專屬備援主機,分享式備援主機的觀念通常用於異地備援服務,即異地備援業者提供一台備援主機服務數個客戶,藉以降低客戶備援服務所需的成本,當系統災難發生時,異地備援業者以客戶的通知而做服務優先順序的排列,分享式主機的好處是平時可以節省備援成本的花費,缺點則為區域性災難(颱風、地震等等)發生時,可能因為客戶通知備援業者的時間較晚,而影響到備援系統的使用權。專屬備援主機則沒有分享式備援主機的缺點,不過平時系統備援的花費卻也相對的升高。


4.備援系統運作能力的選定

備援系統的選定應依企業本身的需求而選定。以備援的角度而言,備援主機或系統的操作能力(Operation Capacity)的要求並非需要與正常運作主機完全一致。理由很簡單,當區域性災難發生時企業的營運可能不會如往常一樣的忙碌,系統的使用量相對的也會減少,又或備援系統的運作應屬於暫時性的狀態,俟正常系統開始操作時則備援系統自然會切換至正常系統來運作,以企業經營的效益與成本控制而言,合理的備援投資應為優先的考量。


5.企業營運所需的相關軟體

系統備援不單僅僅考慮遠端的備援主機或是作業軟體的相容性,公司營運所需的系統可能牽涉到非常複雜的軟體配套,當備援計劃訂定時對於系統所需的軟體必須要有一番的整理與分析。哪些系統營運時需要哪些的軟體配合應詳加記錄,又或那些系統的運作須要那些系統的支援也要經過徹底的分析,如財會與出貨系統是否一起放入備援的機制考量中,以免當災難發生時,備援系統雖然能夠運作,但確無法完全執行企業營運所需的備援能力。


6.正式系統回復時間

正式系統回復的時間長短意謂者何時才能讓企業資訊系統正常運作。備援時期的這段時間,資訊人員如何重建因災難而發生的營運系統停擺。重建系統時可能所需要的設備、主機、軟體系統及與資訊廠商間的聯繫及運作步驟皆需詳細的計錄於系統不中斷計劃中。如此才能達到事半功倍的效果。


制定系統不中斷計劃的步驟
如何建立資訊系統不中斷的計劃,有幾個步驟可供大家參考:


1.現有系統的分析:

應用軟體、資訊系統、資料結構、平時資料備份或系統保護及網路架構的詳細分析,對於資訊系統不中斷計劃的建立有很大的幫助。唯有充份的了解以上所進行的分析,才能制定出一份實用且合理的計劃。


2.企業營運的分析:

企業營運的分析可分成:商業衝擊分析、應用軟體衝擊分析及災害發生取代方案的分析。詳述如下:

a.商業衝擊分析(Business Impact Analysis):

主要是為了及量化營運系統於災難發生時對於商業營運及獲利損失的衝擊,透過如此的分析將有助於了解企業應投資於系統備援的合理經費,也因為正確的商業衝擊分析避免投資的浪費或因投資的不足影響企業的獲利。


b.應用軟體衝擊分析(Application Impact Analysis):

應用軟體可分為ERP系統、資料庫系統及應用程式等等。主要的分析是為了了解應用軟體無法運作時對於企業可能造成的利益損失分析,企業對備援系統的選定通常是與企業經營有息息相關的重要系統,重要系統間是否有一定的依存關係則是需要相當的研究與驗證。


c.替代方案的分析(Alternative Processing Analysis):

當系統災難發生時,現有的運作系統可能無法於第一時間即能馬上獲得。這時,事先的替代方案準備計劃就顯得相當重要。目前的IT環境日新月異,舊產品的取得與技術的支援往往因新產品的推出而不易尋求,替代性方案中可能需要考慮到使用市場上新產品的交替運用,以免因舊產品或不支援的應用軟體形成企業營運的二度傷害。


3.建立計劃備援方案及系統


經由以上的分析作業與系統資料的收集,可開始進入備援架構的設計,服務廠商的選擇,測試,訓練及整合階段。在這一階段企業的資訊人員應該對於系統備援預算(Budge)、系統備援範圍(Scope)、企業資料量遺失容忍度(Data Lost)、R.T.O.(Recovery Time Object)、R.P.O.(Recovery Time Object)及正常系統回復(Fall Back)的標準及計劃流程皆有了相當的認識,如此便可以開始進行備援方案的計劃與備援系統的建立。


後續需不斷演練及改進
一個計劃若沒有透過不斷的演練與改進則稱不上是一個好的計劃,資訊系統不中斷計劃也是如此。經由每年定時或不定時的演練,得出系統備援有效的操作與技術的更新。如此才能保持一個完善的備援機制,使企業不因系統中斷而造成無法預估的損失。


系統不中斷的計劃與施行原本就是一項耗大的工程,至於如何選擇有效的計劃與方案來實行,則有賴於專業的技術能力與耐心。過去,企業只要管理好建築、設備等有形資產。然而,隨者企業的e化,企業的獲利與專業知識越來越仰賴資訊系統,由其這幾年來全球經歷了無數的天災與人禍,企業面臨的挑戰更大了,數位資產的保護已是企業是否具競爭力及能否永續經營的關鍵。異地備援就像是為企業的永續經營買保險一樣,每個企業的營運狀況皆不相同,企業應當慎選適合自己所需的異地備援計畫,確保異地備援計畫的有效執行,才能達到企業永續經營的保障。


(作者現職為宏碁電子化資訊管理中心產品設計處專案主任)