介紹
在最基本的層面上來講,系統(tǒng)有效性是指系統(tǒng)在需要時(shí)可以成功運(yùn)行的概率。高系統(tǒng)有效性這一術(shù)語被廣泛地用于一切與生產(chǎn)力有關(guān)的事物,包括可靠性和可維護(hù)性。通過高有效性,可以構(gòu)建冗余和可恢復(fù)性系統(tǒng)。該系統(tǒng)激發(fā)了連鎖反應(yīng),用光纖基礎(chǔ)設(shè)施完成設(shè)置,能夠提供各種容錯(cuò)級(jí)別的產(chǎn)品和解決方案。特別值得一提的是,光纖矩陣路由和擴(kuò)展解決方案,不僅可以提供模塊化冗余系統(tǒng)架構(gòu)的機(jī)制,還具有高帶寬、低成本、支持復(fù)雜的拓?fù)浣Y(jié)構(gòu)等優(yōu)點(diǎn)。因此,Thinklogical公司設(shè)計(jì)了一套基于光纖的冗余矩陣路由和擴(kuò)展解決方案,以滿足在模塊化冗余系統(tǒng)中進(jìn)行可靠信號(hào)傳輸?shù)男枨蟆?/p>
冗余和可恢復(fù)性系統(tǒng)的高有效性
冗余涉及到多種技術(shù),這些技術(shù)都與物理備份有關(guān),而彈性則主要與通信協(xié)議有關(guān)。冗余設(shè)備在發(fā)生故障時(shí)可以激活,但如果沒有很好的彈性,就有可能丟失數(shù)據(jù),甚至?xí)l(fā)生無法建立冗余連接這種更糟糕的情況。彈性系統(tǒng)在發(fā)生故障時(shí)會(huì)返回到一個(gè)可操作狀態(tài)。因此,如果一個(gè)故障使系統(tǒng)離線的話,高度彈性的系統(tǒng)可以在最短的停機(jī)時(shí)間內(nèi)恢復(fù)其預(yù)定的工作和功能。
建立冗余和可恢復(fù)性系統(tǒng),需要進(jìn)行全盤考慮。必須逐一考慮每個(gè)潛在的風(fēng)險(xiǎn),不僅要考慮如何降低風(fēng)險(xiǎn),還要保證如何最大限度地減少其對(duì)系統(tǒng)的影響。冗余系統(tǒng)的要求或需求基于以下一套標(biāo)準(zhǔn)問題:
·系統(tǒng)是否需要全天候運(yùn)行,停機(jī)是不可接受的嗎?
·如果系統(tǒng)發(fā)生故障,是否需要無縫地從主系統(tǒng)切換到備份系統(tǒng)?
·信號(hào)源和目標(biāo)地之間數(shù)據(jù)共享的恒定和可靠要達(dá)到什么樣的程度?
·怎樣才能盡量減少系統(tǒng)內(nèi)的單點(diǎn)故障,如何確保構(gòu)建基礎(chǔ)結(jié)構(gòu)的設(shè)備不會(huì)使系統(tǒng)整體停止運(yùn)作?
通過冗余和容錯(cuò)實(shí)現(xiàn)的高有效性,是許多矩陣路由和擴(kuò)展設(shè)備的重要組成部分,尤其是在安全可視化計(jì)算環(huán)境中。如果說幾分鐘的企業(yè)系統(tǒng)故障只是一種不便的話,那么失去安全可視化計(jì)算系統(tǒng)則是一場災(zāi)難。如果控制系統(tǒng)不起作用或顯示不良會(huì)造成經(jīng)濟(jì)的重大損失、設(shè)備損壞、擾亂公共服務(wù)和/或安全的話,通常就需要使用某種形式的冗余和容錯(cuò)。這些情況下的冗余意味著雙重甚至三重設(shè)備備份,在主設(shè)備出現(xiàn)故障時(shí)能夠無中斷運(yùn)作。在這些類型的使用環(huán)境中,故障成本太高,冗余系統(tǒng)是至關(guān)重要的。
通過使用光纖解決方案來設(shè)計(jì)冗余系統(tǒng),用戶可以享有高度可靠的數(shù)據(jù)傳輸、降低安裝成本以及保證根據(jù)需求的改變進(jìn)行升級(jí)。本文將討論幾種不同的基于光纖的冗余和容錯(cuò)功能以及結(jié)構(gòu),但主要集中闡述雙模塊冗余,也稱為并聯(lián)冗余,這正是Thinklogical公司的系統(tǒng)所采用的方法。本文還將突出介紹一系列有助于提高系統(tǒng)有效性的Thinklogical公司的產(chǎn)品。
組件的冗余
確保可靠運(yùn)作最重要的一步就是能提供冗余的、熱插拔的組件。系統(tǒng)的模塊或組件能夠無縫地被去除、更換或增加也是很關(guān)鍵的。更換也不應(yīng)該需要重新布線或重新編程。此外,目前也發(fā)明了許多新方法,比如一種基于狀態(tài)的管理以及能夠自動(dòng)學(xué)習(xí)的診斷程序,就可以提高控制器檢測、通知并描述組件故障的能力。對(duì)許多用戶來說,無需關(guān)閉系統(tǒng)就可以進(jìn)行維護(hù)和修改系統(tǒng)的功能是非常有用的,尤其是如果這種改變或維修能夠在幾分鐘內(nèi)完成的話。
系統(tǒng)的關(guān)鍵組件
● 不間斷電源(UPS)
● 冗余供電
● 冗余組件
·機(jī)箱·處理器
·I/O模塊
·傳感器和驅(qū)動(dòng)器
·計(jì)算機(jī)/用戶界面
·網(wǎng)絡(luò)
·媒體
·服務(wù)器
·數(shù)據(jù)庫
Thinklogical的系統(tǒng)應(yīng)急
電源的冗余是一種常用的增強(qiáng)系統(tǒng)有效性的方法。單電源故障會(huì)造成災(zāi)難性的后果,帶來巨額的經(jīng)濟(jì)損失。在這種苛刻的條件下要確保系統(tǒng)的完整性和性能就需求采用電源冗余。因此,所有Thinklogical的矩陣路由和模塊化擴(kuò)展產(chǎn)品都配備有冗余的支持熱插拔的電源。
Thinklogical的VX和HDX系列矩陣路由器的關(guān)鍵組件設(shè)計(jì)都支持熱插拔,比如風(fēng)扇和光纖插座(SFP+),從而盡可能地減小了某個(gè)組件發(fā)生故障對(duì)業(yè)務(wù)系統(tǒng)的影響。熱插拔的I/O板卡也提供了優(yōu)秀的在線擴(kuò)展能力,不用關(guān)閉矩陣路由器電源中斷信號(hào)處理就可以進(jìn)行重新配置。此外,HDX系列矩陣路由器配有雙控制卡,在發(fā)生故障時(shí)可以在兩塊卡之間進(jìn)行切換。

冗余模式
在行業(yè)中有許多通用的冗余模式,比如備用冗余和雙模塊冗余,或叫做并聯(lián)冗余。
備用冗余
備用冗余指的是有一個(gè)一樣的備用設(shè)備作為主設(shè)備的備份。在備用冗余里,備份設(shè)備不分享任何的負(fù)載,只有在主設(shè)備發(fā)生故障時(shí)它們才會(huì)被使用。此外,可能要由第三方來監(jiān)視系統(tǒng),并在需要時(shí)給出切換命令。
在備用冗余中,備份設(shè)備的設(shè)置有三種狀態(tài):冷備份、熱備份和在線備份。在冷備份中,為了保護(hù)備份設(shè)備的壽命,電源是關(guān)閉的。這種模式的缺點(diǎn)是需要用很長的時(shí)間來使備份系統(tǒng)啟動(dòng)并運(yùn)行。雖然硬件和軟件都是可用的,但都需要通電才能進(jìn)入當(dāng)前的操作狀態(tài)。
熱備份響應(yīng)時(shí)間更快,因?yàn)閭浞?冗余)系統(tǒng)一直在運(yùn)行,并且定期與控制設(shè)備(DUC)進(jìn)行同步。在主系統(tǒng)發(fā)生故障時(shí),冗余系統(tǒng)可以從故障系統(tǒng)中斷開,并接入備份系統(tǒng)。這使系統(tǒng)可以快速恢復(fù)(通常在幾秒鐘內(nèi))并繼續(xù)工作。盡管在斷開/重連的過程中會(huì)丟失一些數(shù)據(jù),熱備份在那些對(duì)少許數(shù)據(jù)丟失不敏感的領(lǐng)域內(nèi)是一個(gè)可接受的方案。
在這兩種類型的冗余模式里,系統(tǒng)的切換都不是無縫的,也增加了故障的概率。為了消除這種增加的概率,需要在冗余系統(tǒng)中增加額外的硬件(第三方選擇器)來幫助系統(tǒng)從主設(shè)備切換到備份設(shè)備。雖然這些系統(tǒng)組件增強(qiáng)了可靠性,但它們通常是串聯(lián),這就造成了一種串并聯(lián)的連接,又為系統(tǒng)帶來了新的故障點(diǎn)。此外,因?yàn)樵黾恿祟~外的硬件設(shè)備,這種系統(tǒng)的成本通常會(huì)翻倍。
在線備份意味著主、備數(shù)據(jù)系統(tǒng)同時(shí)運(yùn)作,并同時(shí)提供同樣的數(shù)據(jù)流給下游用戶。如果主系統(tǒng)出故障了,那么切換到備份系統(tǒng)是完全無縫的,或者說是“無沖擊的”,也不會(huì)丟失數(shù)據(jù)。用戶如果無法容忍冷備份和熱備份系統(tǒng)的數(shù)據(jù)丟失,那么在線備份就是最佳的選擇。在線備份模式也會(huì)有一些變化,比如雙模塊冗余或叫做并聯(lián)冗余。這些模式之間的主要區(qū)別是看主系統(tǒng)和備份系統(tǒng)之間的同步有多緊密。[page]
雙重模塊冗余(DMR)或并聯(lián)冗余
多個(gè)設(shè)備并聯(lián)并完全同步的運(yùn)行,這種方法被稱為DMR或并聯(lián)冗余。這種模式的特點(diǎn)是切換時(shí)間非常短。
雙系統(tǒng)冗余具有以下三個(gè)基本原則:
1、物理隔離的信號(hào)路徑
2、雙機(jī)箱冗余的信號(hào)控制器
3、狀態(tài)信息同步
一套DMR矩陣路由和擴(kuò)展系統(tǒng)配置了兩臺(tái)并聯(lián)運(yùn)行、緊密同步的主路由器和備份矩陣路由器。同一個(gè)信號(hào)同時(shí)傳輸?shù)絻膳_(tái)鏡像矩陣路由器中,再把這些信號(hào)發(fā)送到目的接受端。如果有多個(gè)矩陣路由器的話,你就要辨別哪一個(gè)信號(hào)是正確的,這是個(gè)問題。不對(duì)運(yùn)行參數(shù)進(jìn)行動(dòng)態(tài)檢查就武斷授予一臺(tái)矩陣路由器優(yōu)先權(quán),選擇一個(gè)你“最相信”的設(shè)備是不可取的。同時(shí),監(jiān)測并決定什么時(shí)候切換到備份設(shè)備也是很復(fù)雜的。
Thinklogical的優(yōu)勢
Thinklogical公司設(shè)計(jì)了一套經(jīng)濟(jì)、彈性的解決方案來解決DMR模式的復(fù)雜性。這一功能被設(shè)計(jì)在SDI Xtreme 3G+接收器中,稱為“切換能力”。這使組件可以同時(shí)接收兩個(gè)輸入光纖上同樣的數(shù)據(jù)流。默認(rèn)情況下,它會(huì)通過在接收到的數(shù)據(jù)流中搜索同步字符,嘗試與“主”光纖進(jìn)行同步。同時(shí),它還會(huì)檢查“備份”光纖,嘗試與其同步。在一段預(yù)定的時(shí)間后,會(huì)選擇任何一個(gè)接收器鎖定的數(shù)據(jù)流,從中解碼出SDI數(shù)據(jù)。如果所選擇的數(shù)據(jù)流丟失同步,接收器會(huì)自動(dòng)選擇其他的數(shù)據(jù)流。在切換時(shí)SDI視頻只有極少的丟失。為了防止切換器在間歇信號(hào)之時(shí)來回切換,接收器會(huì)繼續(xù)使用“切換過的”數(shù)據(jù)流,不管它是否重新鎖定到原來的流。如果發(fā)生類似于切換過的數(shù)據(jù)流丟失鎖定這種情況時(shí),接收器會(huì)嘗試切回到原來的流。
這種同步方案確保了系統(tǒng)中無論哪個(gè)點(diǎn)發(fā)生故障,都能夠有最大正常運(yùn)行時(shí)間。有趣的是,這種方法反映了在實(shí)現(xiàn)災(zāi)難恢復(fù)時(shí)共同的典型設(shè)計(jì)。事實(shí)上,絕大部分高有效性系統(tǒng)遵循這個(gè)樸素的設(shè)計(jì)方式:一個(gè)單獨(dú)的、高品質(zhì)的、多功能的具有全面內(nèi)部彈性的物理系統(tǒng)運(yùn)行相關(guān)功能,并與備份、物理隔離、完全一樣的系統(tǒng)相配對(duì)。這種設(shè)計(jì)的首要目的是預(yù)防失效,或從失效中迅速恢復(fù)過來,這允許系統(tǒng)可以在任何重要組件部分或全部失效時(shí),繼續(xù)運(yùn)行。
總結(jié)
冗余的想法并不難理解,但實(shí)現(xiàn)它卻需要一些思考。最開始關(guān)于冷、熱以及在線備份的決定會(huì)影響到實(shí)現(xiàn)時(shí)的所有方面。對(duì)一個(gè)性能良好的系統(tǒng)來說,選擇適當(dāng)?shù)挠布蛷?qiáng)大的系統(tǒng)結(jié)構(gòu)是決定性的。
很顯然,如果沒有一個(gè)綜合的矩陣路由和擴(kuò)展解決方案,公司就不能充分享受冗余模式的好處。Thinklogical公司的系統(tǒng)解決方案為具有創(chuàng)新精神的公司提供了創(chuàng)造高密度、可升級(jí)、冗余系統(tǒng)結(jié)構(gòu)的能力,以獲得廣泛的功能和高投資回報(bào)率。要記住更低的系統(tǒng)成本并不總是等于更低的總成本,這一點(diǎn)非常重要。不過更重要的是,一次意外關(guān)機(jī)的成本遠(yuǎn)遠(yuǎn)大于冗余的成本。如果數(shù)據(jù)的連通性對(duì)公司或組織是至關(guān)重要的話,那么就應(yīng)該考慮安裝冗余系統(tǒng),并在選擇關(guān)鍵設(shè)備時(shí)仔細(xì)進(jìn)行權(quán)衡。