NEC ExpressCluster? X 3.0 純軟熱備方式簡介
1 概述 |
信息化建設(shè)的不斷推進,各個企事業(yè)單位的活動越來越多的依賴于其關(guān)鍵的業(yè)務(wù)信息系統(tǒng),這些業(yè)務(wù)信息系統(tǒng)對整個機構(gòu)的運營和發(fā)展起著至關(guān)重要的作用,一旦發(fā)生宕機故障或應(yīng)用停機,將給機構(gòu)帶來**的經(jīng)濟損失。
可見,對那些需要**信息安全和提供不間斷的信息服務(wù)的機構(gòu)來說,業(yè)務(wù)系統(tǒng)的容錯性和不間斷性顯得尤為重要。如何**各種關(guān)鍵應(yīng)用持續(xù)運營,達到永續(xù)經(jīng)營的良性循環(huán),已成為當今企事業(yè)單位和IT領(lǐng)域急需解決的關(guān)鍵問題。
2 軟件功能簡介 |
薈萃NEC技術(shù)精華的EXPRESSCLUSTER是一款**的高可用集群軟件產(chǎn)品(雙機熱備集群軟件),可為您提供Windows和Linux平臺上完整的高可用性解決方案。當集群中的某個節(jié)點由于軟件或硬件原因發(fā)生故障時,集群系統(tǒng)可以把IP、客戶業(yè)務(wù)等資源切換到其他健康的節(jié)點上,使整個系統(tǒng)能連續(xù)不間斷的對外提供服務(wù),從而為機構(gòu)24x365的關(guān)鍵業(yè)務(wù)提供了**的**,達到了系統(tǒng)99.999%的高可用性和**性。
NEC ExpressCluster? X 3.0 語言支持:中文、英文、日文。
NEC ExpressCluster? X 3.0 較大節(jié)點數(shù):
支持2~32節(jié)點
NEC ExpressCluster? X 3.0 配置信息備份:集群配置信息可以導(dǎo)入、導(dǎo)出。配置好NEC軟件之后可以選擇導(dǎo)出配置文件保存,如果出現(xiàn)系統(tǒng)宕機,*重新配置NEC軟件,即可恢復(fù)集群,可以通過導(dǎo)入配置文件,**建立雙機系統(tǒng);對于系統(tǒng)更改主機名,IP地址等相應(yīng)的信息,只需簡單操作就可以完成NEC軟件系統(tǒng)的修改。
NEC ExpressCluster? X 3.0 報警功能:不僅有event log輸出、AlertView顯示、還支持手機短信、Email、旋轉(zhuǎn)燈方式的通報功能。
NEC ExpressCluster? X 3.0 BS架構(gòu)管理工具:
實現(xiàn)了Windows和Linux兩個平臺上的產(chǎn)品的管理接口的統(tǒng)一。*屏蔽了平臺差異性。
只要有瀏覽器和Java運行環(huán)境,任何一臺機器都可以進行監(jiān)控,維護和配置操作。
可以在一個頁面上同時顯示多個集群的狀態(tài), 無論是Windows集群還是Linux集群,一目了然。
NEC ExpressCluster? X 3.0 日志收集功能:提供log自動收集工具,可在管理控制臺自動收集所有集群服務(wù)器的日志信息,并且可供收集的log種類豐富,除了EC本身的內(nèi)部日志以外,還可收集系統(tǒng)日志、注冊表信息、系統(tǒng)診斷報告等等
NEC ExpressCluster? X 3.0 故障監(jiān)視功能:可以對主機的網(wǎng)卡、本地磁盤、存儲、應(yīng)用程序、進程、服務(wù)、操作系統(tǒng)、服務(wù)器自我監(jiān)視等。當主機發(fā)生任何故障后, NEC ExpressCluster? X 3.0將自動、**的把主服務(wù)器上的所有資源切換到備服務(wù)器上,確保應(yīng)用程序持續(xù)可用性,**公司業(yè)務(wù)的持續(xù)運行。
NEC ExpressCluster? X 3.0 的集群結(jié)構(gòu): 共享磁盤型、數(shù)據(jù)鏡像型、共享磁盤鏡像型、虛擬平臺集群、無磁盤型、共享和鏡像共存型、NAS型。
NEC ExpressCluster? X 3.0 的運行方式支持: Active/Standby 、Active/Active、N+1備份、M+N備份和遠程集群:
Active/Standby:其中一臺服務(wù)器作為 Active 主機,運行重要的應(yīng)用程序,向客戶端提供各種應(yīng)用服務(wù),另一臺服務(wù)器作為備機,實時監(jiān)控 Active 主機運行情況,只有當 Active 主機發(fā)生故障后,備機才接管 Active 主機上的應(yīng)用服務(wù)。
Active/Active :每臺主機上運行各自的應(yīng)用程序。服務(wù)器在運行自身的應(yīng)用服務(wù)時,同時也是另一臺主機的備機,即兩臺主機互為備機。
N+1備份:有N臺主服務(wù)器上運行各自的應(yīng)用程序,1臺服務(wù)器做為這N臺主服務(wù)器的備服務(wù)器;當有任何一臺主服務(wù)器發(fā)生故障,這臺備服務(wù)器就會接管此主服務(wù)器上的應(yīng)用程序。
M+N備份:有M臺主服務(wù)器上運行各自的應(yīng)用程序,N臺服務(wù)器做為這M臺主服務(wù)器的備服務(wù)器;當有任何一臺主服務(wù)器發(fā)生故障,這N臺備服務(wù)器中對應(yīng)的那臺應(yīng)用服務(wù)器就會接管此主服務(wù)器上的應(yīng)用程序。
遠程集群:兩座城市之間對應(yīng)用程序做高可用保護,只有一座城市的應(yīng)用服務(wù)器運行此應(yīng)用程序,當此應(yīng)用程序出現(xiàn)故障,另一座城市的服務(wù)器馬上接管此應(yīng)用程序。
NEC ExpressCluster? X 3.0 解決方案:雙機雙柜(數(shù)據(jù)鏡像型)、雙機單柜(共享磁盤型)、雙機無柜(數(shù)據(jù)鏡像型\無磁盤型)、多機單柜(共享型)等等。
NEC ExpressCluster? X 3.0 支持的操作系統(tǒng):windows、linux等等。
NEC ExpressCluster? X 3.0 支持的數(shù)據(jù)庫:oracle、mssql、sql server、DB2、sybase等等。
NEC ExpressCluster? X 3.0 支持的應(yīng)用程序:如web、his、lis、pacs、erp、收費、語音、視屏等等,所有的應(yīng)用程序都支持。
HA (High Availability)集群
一般提升系統(tǒng)可用性時,會認為對構(gòu)成系統(tǒng)的組件進行冗余化,消除Single Point of Failure 是重要的。所謂Single Point of Failure 指的是計算機的構(gòu)成要素(硬件的組件)因為只有一個,所以該處發(fā)生故障時會有使業(yè)務(wù)停止的弱點。所謂HA 集群是使用多臺節(jié)點進行冗余化操作、將系統(tǒng)停止時間控制在較小限度,提升業(yè)務(wù)可用性(availability)的集群系統(tǒng)。
某些骨干業(yè)務(wù)系統(tǒng)等的宕機會給業(yè)務(wù)帶來很大影響,因此此類系統(tǒng)不允許停止,需要導(dǎo)入HA 集群。
圖 2-1 HA 集群構(gòu)成圖
HA 集群可分為共享磁盤型和鏡像磁盤型。以下開始逐一進行說明。
a) 共享磁盤型
集群系統(tǒng)中服務(wù)器間**要交接數(shù)據(jù)。將這些數(shù)據(jù)從多個服務(wù)器放到象以SAN 連接的FibreChannel 磁盤陣列裝置這樣可以訪問的外置磁盤(共享磁盤)上,通過該磁盤在服務(wù)器間交接數(shù)據(jù)即稱為共享磁盤型集群系統(tǒng)。
運行業(yè)務(wù)應(yīng)用程序的服務(wù)器(當前服務(wù)器)發(fā)生故障時,集群系統(tǒng)查出故障并在交接業(yè)務(wù)的服務(wù)器(待機服務(wù)器)中自動運行業(yè)務(wù)應(yīng)用程序,交接業(yè)務(wù)。這稱為失效切換。集群系統(tǒng)交接的業(yè)務(wù)由磁盤、IP 地址、應(yīng)用程序等資源構(gòu)成。
在沒有集群化的系統(tǒng)中使用其它服務(wù)器重啟應(yīng)用程序時,客戶端**再次連接不同的IP 地址。但是多數(shù)的集群系統(tǒng)里不是以業(yè)務(wù)為單位給服務(wù)器分配IP,而是分配其他網(wǎng)絡(luò)的IP地址(虛擬IP 地址)。因此客戶端沒必要去區(qū)分正在執(zhí)行業(yè)務(wù)的是當前服務(wù)器還是待機服務(wù)器,如同連接同一個服務(wù)器一樣,可以持續(xù)的運行業(yè)務(wù)。
由于當前服務(wù)器宕機發(fā)生失效切換時,共享磁盤上的數(shù)據(jù)沒有進行妥當?shù)慕Y(jié)束處理就交接給待機服務(wù)器。因此待機服務(wù)器中有必要對交接的數(shù)據(jù)進行邏輯檢查。這與一般未集群化的系統(tǒng)宕機后重啟時進行的處理是一樣的。例如,如果是數(shù)據(jù)庫就需要回滾及前滾的處理。由此客戶端僅運行未提交的SQL 文就可以繼續(xù)業(yè)務(wù)。
故障發(fā)生后,被查出故障的服務(wù)器經(jīng)過物理隔離修復(fù)后、只要連接集群系統(tǒng)就可以作為待機服務(wù)器恢復(fù)運行。重視業(yè)務(wù)連續(xù)性的實際操作中,也可以不進行組的故障恢復(fù)。如果**要在原來的服務(wù)器上運行業(yè)務(wù)時,請移動組。
圖 2-2 從發(fā)生故障到恢復(fù)的流程
出于失效切換處的服務(wù)器配置不夠、雙向待機引起**負荷等理由而希望在原來的服務(wù)器上運行業(yè)務(wù)時,原來節(jié)點的恢復(fù)作業(yè)完成后將暫時停止業(yè)務(wù),在原來的節(jié)點上重啟業(yè)務(wù)。將失效切換的組返回原來的服務(wù)器稱為故障恢復(fù)。
如圖1-3 所示,只有1 個業(yè)務(wù),待機服務(wù)器為不運行業(yè)務(wù)的待機形態(tài)稱為單向待機。有2個以上業(yè)務(wù),各自的節(jié)點既為當前服務(wù)器又為待機服務(wù)器的形態(tài)稱為雙向待機。
圖 2-3 HA 集群的運行形態(tài)
b) 鏡像磁盤型(純軟方式)
上述共享磁盤型適用于大規(guī)模系統(tǒng),但共享磁盤大體價格較高因此構(gòu)筑系統(tǒng)的成本也會增大。于是,不使用共享磁盤,而是通過將各服務(wù)器磁盤在服務(wù)器間建立鏡像,可以以較低的價格實現(xiàn)相同功能,這類集群系統(tǒng)稱為鏡像磁盤型集群系統(tǒng)。
但是,由于需要在服務(wù)器間為數(shù)據(jù)建立鏡像,因此不適用于需要大量數(shù)據(jù)的大規(guī)模系統(tǒng)。應(yīng)用程序一發(fā)出Write 請求,數(shù)據(jù)鏡像引擎就會在本地磁盤上寫入數(shù)據(jù)。寫入的數(shù)據(jù)通過心跳線也會給待機服務(wù)器分配Write 要求。所謂心跳線是連接在服務(wù)器之間的電纜,在集群系統(tǒng)中用于服務(wù)器的死活監(jiān)視。鏡像磁盤型中除死活監(jiān)視外還用于數(shù)據(jù)的傳送。待機服務(wù)器的數(shù)據(jù)鏡像引擎通過將接收的數(shù)據(jù)寫入待機服務(wù)器的本地磁盤中,使當前服務(wù)器和待機服務(wù)器間的數(shù)據(jù)實現(xiàn)同步。
對于應(yīng)用程序發(fā)出的Read 請求,僅從當前服務(wù)器的磁盤中讀取。
圖 2-4 數(shù)據(jù)鏡像的結(jié)構(gòu)
快照備份就是使用數(shù)據(jù)鏡像的例子。因鏡像磁盤型的集群系統(tǒng)在2 個地方持有共享數(shù)據(jù),只需將待機服務(wù)器從集群分離,即可作為快照備份來保存數(shù)據(jù)。
4 EXPRESSCLUSTER的特點及技術(shù)優(yōu)勢
EXPRESSCLUSTER提供*的實時故障監(jiān)視,可以監(jiān)視網(wǎng)絡(luò)、存儲、服務(wù)器、操作系統(tǒng)、應(yīng)用軟件、EXPRESSCLUSTER自身服務(wù)狀態(tài)、待機服務(wù)器上的軟硬件資源的狀態(tài)。
EXPRESSCLUSTER的網(wǎng)絡(luò)心跳通過系統(tǒng)的內(nèi)核空間進行,不受系統(tǒng)負荷的影響。除了支持網(wǎng)絡(luò)心跳外,還可以通過COM口、存儲設(shè)備上的特定分區(qū)、以及Ping第三方的方式確認服務(wù)器的狀態(tài)。
除了對應(yīng)用程序和服務(wù)進行常規(guī)級別的監(jiān)視外(所謂常規(guī)級別的監(jiān)視,即進程死活級別的監(jiān)視),EXPRESSCLUSTER還提供了一系列監(jiān)視選件產(chǎn)品,如Database Agent、Internet Server Agent、Application Server Agent、File Server Agent等,這些監(jiān)視選件產(chǎn)品定期對應(yīng)用程序進行實際的訪問處理,探測應(yīng)用的響應(yīng)時間,返回結(jié)果等狀態(tài),從而實現(xiàn)對應(yīng)用程序和服務(wù)的僵死狀態(tài)(Stall)的監(jiān)視,為用戶的關(guān)鍵業(yè)務(wù)系統(tǒng)提供了較深層次的保護。EXPRESSCLUSTER的監(jiān)視選件可以支持4個領(lǐng)域內(nèi)的大部分主流應(yīng)用,包括數(shù)據(jù)庫服務(wù)器、互聯(lián)網(wǎng)服務(wù)器、文件服務(wù)器和應(yīng)用服務(wù)器等。
4.2 數(shù)據(jù)庫監(jiān)視選件(Database僵死狀態(tài)**)
除了對應(yīng)用程序和服務(wù)的常規(guī)級別的監(jiān)視外(所謂常規(guī)監(jiān)視即進程死活級別的監(jiān)視), EXPRESSCLUSTER還提供了一系列監(jiān)視選項產(chǎn)品,如Database Agent,Internet Server Agent, LAN Agent, File Server Agent等,這些監(jiān)視選項產(chǎn)品可對EXPRESSCLUSTER上運行的數(shù)據(jù)庫等應(yīng)用程序和服務(wù)的僵死狀態(tài)(Stall)進行監(jiān)視,從而為用戶的關(guān)鍵業(yè)務(wù)系統(tǒng)提供了較深層次的保護。
? 功能簡介
本選件支持的數(shù)據(jù)庫軟件如下所示:
2 Oracle10g/Oracle 9i
2 DB2 Universal Database (V8.1/V8.2)※2
2 Sybase Adaptive Server Enterprise 12.5
2 PostgreSQL
2 PowerGres Plus
2 MySQL
? 監(jiān)視方法概要
本選件提供了可設(shè)置在腳本中的監(jiān)控命令,以監(jiān)視數(shù)據(jù)庫軟件的運行。一執(zhí)行本監(jiān)視命令,即開始持續(xù)以參數(shù)所*的間隔對數(shù)據(jù)庫軟件進行監(jiān)視處理,直到查出數(shù)據(jù)庫軟件異常。一旦查出異常,本監(jiān)視命令馬上結(jié)束。本監(jiān)視命令通過在EXPRESSCLUSTER的失效切換組中的EXEC資源中描述腳本來使用。一旦查出數(shù)據(jù)庫軟件異常,監(jiān)視命令就馬上結(jié)束,根據(jù)EXEC資源的設(shè)置,使數(shù)據(jù)庫軟件發(fā)生失效切換或執(zhí)行本地恢復(fù)等操作。
EXPRESSCLUSTER支持目前國內(nèi)幾乎所有主流的Windows和Linux操作系統(tǒng)平臺,如Windows NT/2000/2003、RedHat、TurboLinux、MiracleLinux、Novell SUSE Linux、RedFlag等。其硬件平臺兼容性好,支持IA32、X86_64、IA64、PPC64等硬件平臺,還可以支持FT服務(wù)器、刀片服務(wù)器等特殊用途的硬件設(shè)備。
EXPRESSCLUSTER支持虛擬環(huán)境。當虛擬計算機上運行的業(yè)務(wù)發(fā)生故障時,EXPRESSCLUSTER可以將其切換到另外一個虛擬計算機。如果虛擬機軟件本身發(fā)生故障,或者物理服務(wù)器發(fā)生故障,EXPRESSCLUSTER還能夠?qū)⑻摂M計算機整個切換到另外一臺物理服務(wù)器上。除此之外,還可以利用虛擬計算機,對物理服務(wù)器進行備份。例如,如果希望利用一臺服務(wù)器,分別對運行不同操作系統(tǒng)的物理服務(wù)器進行備份,利用虛擬技術(shù)與EXPRESSCLUSTER相結(jié)合,將很容易就可以實現(xiàn)。
EXPRESSCLUSTER在應(yīng)用方式上的另一個創(chuàng)舉就是將鏡像型集群應(yīng)用于異地災(zāi)備解決方案中。通常的異地災(zāi)備解決方案,對網(wǎng)絡(luò)環(huán)境要求高、實施復(fù)雜、實現(xiàn)成本也比較昂貴。而利用鏡像型集群軟件的異地災(zāi)備解決方案,不但能夠異地備份業(yè)務(wù)數(shù)據(jù),還可以對軟硬件資源進行監(jiān)視,在主節(jié)點發(fā)生故障時,能夠自動在備份節(jié)點上恢復(fù)業(yè)務(wù),將業(yè)務(wù)服務(wù)的停止控制在較小限度內(nèi)。
并且,EXPRESSCLUSTER還針對單鏈路低帶寬網(wǎng)絡(luò)環(huán)境,對鏡像復(fù)制功能進行了改造和強化。以前的鏡像型集群中,為了**兩臺服務(wù)器上數(shù)據(jù)的一致性,需要等待兩臺服務(wù)器上的寫操作全部完成,才會進行下一步的處理。這樣的處理機制在遠程鏡像結(jié)構(gòu)中,由于網(wǎng)絡(luò)的延遲和帶寬的影響,會大大影響主服務(wù)器上業(yè)務(wù)的處理效率。而EXPRESSCLUSTER提供一種異步鏡像的方式,可以將本地磁盤的寫操作和遠程鏡像復(fù)制分開,回避遠程復(fù)制對業(yè)務(wù)處理效率的影響。
利用遠程鏡像型集群實現(xiàn)異地災(zāi)備,是一個性價比很高的低成本解決方案。特別是對小規(guī)模系統(tǒng)的容災(zāi)需求,是一個非常好的選擇。
EXPRESSCLUSTER提供基于B/S結(jié)構(gòu)的標準GUI用戶界面,采用樹狀層級顯示,集群架構(gòu)清楚明了?;?/span>Java的開發(fā)技術(shù),支持遠程管理與操作,可在統(tǒng)一的界面下,用統(tǒng)一的方式同時管理多個不同平臺上的集群(Windows與Linux集群均可),在集群各個節(jié)點上可以看到同樣詳細的管理信息和管理功能。可以在日志視圖中顯示系統(tǒng)的詳細信息,便于管理者及時發(fā)現(xiàn)集群的各種問題。在發(fā)生故障或進行切換時,系統(tǒng)可以自動向管理員發(fā)送故障通知郵件。還可以通過外接的網(wǎng)絡(luò)報警燈設(shè)備,進行聲光方式的故障報警。這樣較大的方便了系統(tǒng)管理員的操作和管理。
EXPRESSCLUSTER提供集群構(gòu)筑工具Cluster Builder,標準的GUI界面,操作簡便易行,為管理員提供樹狀圖顯示集群全局,層次分明。通過預(yù)先配置集群的各種參數(shù),當創(chuàng)建集群時只需在構(gòu)成集群的一臺服務(wù)器上讀入集群的配置信息文件,其他的服務(wù)器便可自動獲取集群信息并加入到該集群中,這樣就可以同時完成多臺服務(wù)器的設(shè)置,實現(xiàn)了平滑導(dǎo)入,大大方便了系統(tǒng)管理員的操作。系統(tǒng)將安裝和配置操作分開,可以復(fù)制、備份、離線編輯配置文件,不論是聯(lián)機或脫機狀態(tài),管理員都可以非常方便地修改集群配置信息,一旦發(fā)生故障需要更換服務(wù)器時,只需將配置文件導(dǎo)入即可迅速完成恢復(fù)。
詞條
詞條說明
三木聯(lián)合數(shù)據(jù)保護*——NEC ExpressCluster
? NEC ?ExpressCluster? X 3.0 ?純軟熱備方式簡介 1????? 概述 信息化建設(shè)的不斷推進,各個企事業(yè)單位的活動越來越多的依賴于其關(guān)鍵的業(yè)務(wù)信息系統(tǒng),這些業(yè)務(wù)信息系統(tǒng)對整個機構(gòu)的運營和發(fā)展起著至關(guān)重要的作用,一旦發(fā)生宕機故障或應(yīng)用停機,將給機構(gòu)帶來**的經(jīng)濟損失。 ??&
聯(lián)系人: 王斌
電 話: 010-51657615-813
手 機: 15011208594
微 信: 15011208594
地 址: 北京朝陽北京市朝陽區(qū)北苑路86號嘉銘桐城C5-5094
郵 編: 100010
網(wǎng) 址: wb570359642.cn.b2b168.com
聯(lián)系人: 王斌
手 機: 15011208594
電 話: 010-51657615-813
地 址: 北京朝陽北京市朝陽區(qū)北苑路86號嘉銘桐城C5-5094
郵 編: 100010
網(wǎng) 址: wb570359642.cn.b2b168.com