本站小編為你精心準備了銀行業分行虛擬化雙活技術探索實踐參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:目前,隨著信息化建設的迅猛發展,在傳統IT架構下,銀行業數據中心系統數量越來越多,服務器、存儲、網絡等設備保有量和增長量持續壯大,如何更科學地整合資源、更靈活高效地部署、更安全可控地掌控,成為橫亙在技術人員面前的問題。對此,興業銀行廣州分行信息科技部探索實現了引入虛擬化存儲雙活技術的方案,主要將服務器虛擬化和存儲雙活災備兩者相結合,實現了高效靈活、安全可控的架構模式。
關鍵詞:服務器虛擬化;雙活;災備
近年來,銀行受互聯網金融、大數據以及云計算的影響,其IT信息化建設發展迅速,銀企之間的業務運營、交易結算、管理溝通越來越依賴于信息系統的支撐,日益增長的服務器和存儲設備、急速膨脹的數據量、越來越緊張的機房場地、業務連續性要求的不斷提高等,都給銀行業各級數據中心帶來了嚴峻的考驗。
一、項目背景
目前,興業銀行廣州分行生產系統眾多,服務器數量持續增長,中心機房基礎設施資源緊張,面臨如下幾個問題。
(一)設備數量持續增長,運營壓力凸顯隨著銀行業務的快速發展,各類系統平臺不斷上線,傳統架構下,每個生產系統采用冷備方式,均需配置一主一備兩臺服務器,服務器保有量越來越多。在這種狀況下,各個系統服務器資源是物理獨立的,資源利用率不高,備機資源平時處于空閑狀態,無法進行統籌均衡管理。同時,維護眾多物理設備,也增加了維護成本以及維護工作量。
(二)機房資源緊張,帶來IT運營風險隱患服務器以及隨之關聯的存儲和網絡設備數量的增長,可能會使得機柜的利用率迅速接近飽和,機房精密空調制冷效果下降,UPS電力負載不斷增加,而機房的基礎環境改造成本較高、涉及面廣、風險較大,難以輕易實施。
(三)開發測試環境,無法高效靈活應對每套系統均需建立開發測試環境,目前提倡的是敏捷開發。而快速迭代時,耗費大量時間去協調物理設備、準備基礎環境、安裝各類應用軟件,這會極大地影響開發效率。
(四)故障維護困難,升級擴容不易當服務器設備進行硬件故障維護或升級擴容時,必須停機操作,此時會中斷在其上運行的業務系統,影響業務連續性。為降低資源消耗和成本投入,減少業務系統的部署成本,提升日常維護效率,提高業務連續性,急迫需要引入當前已得到廣泛應用的虛擬化技術。VMware作為當今IT界虛擬化技術的領航者,可利用“虛擬化+存儲資源池”的技術來整合目前的物理資源,打造分行虛擬化資源管理平臺,實現對IT資源的科學分配、動態管理、靈活部署,從而確保各項業務系統的連續高效運行。
二、項目實施及成效
VMwarevSphere是VMware公司推出的PC服務器虛擬化平臺解決方案,其虛擬化技術將服務器的物理資源抽象成邏輯資源,讓一臺服務器變成多臺相互隔離的虛擬服務器,使得CPU、內存、磁盤等實際物理硬件變為可動態調整分配的資源池。
(一)架構說明此次虛擬化項目的實施,將改變過去單一服務器簡單虛擬化的做法,從而打造三大虛擬化集群:生產系統集群、辦公系統集群、開發測試集群,由VCenter統一管理調度,根據內部網絡的VLAN劃分規則,每個集群之間是網絡隔離的,具體架構如圖1所示。詳細環境說明如下。軟件環境:軟件環境為VMwarevSphere6.5。服務器環境:充分利用現有舊設備,選用部分硬件型號兼容vSphere6.5的舊服務器,型號基本為聯想3650M5,新采購服務器為華為RH2288型號,合計服務器數量約為12臺,規劃三大虛擬化集群各分配4臺服務器。交換機環境:服務器之間的內網采用華為萬兆交換機,服務器與存儲之間采用思科SAN交換機。存儲環境:第一期實施中先使用舊的IBMV7000存儲。
(二)實施過程在實施過程中,本著確保業務連續性和穩定性的原則,采取了新老劃斷的方式:現有的老系統并不立即進行批量遷移,而是利用升級或改造的機會,進行逐一遷移;對于新系統,則統一在該虛擬化平臺上上線。主機安裝:所有服務器配置4個網口作為業務網絡,2個網口作為管理及vMotion網絡,2個網絡預留作為VMFT容錯功能;配置2塊8GFC卡、2塊300G硬盤;配置RAID1;安裝vSphere6.5版本軟件;安裝獨立的VCenter控制臺,將所有主機劃分為三大集群,由VCenter統一管理。網絡規劃:為了滿足網絡流量按照功能隔離傳輸與高可用的要求,需要在每臺主機的網絡配置中將網叉配置到不同的虛擬交換機內,vSwitch0(標準交換機)主要負責vMotion、管理流量,vSwitch1(分布式交換機)主要負責虛擬機的業務流量傳輸,可在虛擬交換機上建立不同VLAN的端口組對網絡進行邏輯上的隔離。存儲設置:服務器通過雙HBA卡和兩臺光纖交換機連接到集中SAN存儲,為存儲劃分出2TB-4TB之間的LUN,掛載到各個主機上。虛擬化基本環境安裝完畢后,可通過具體功能的設置,較好地解決了前文所述的痛點,見表1所列。通過對比可看出,虛擬化項目的實施極大地保障了業務的連續性,提高了服務器資源的使用率,減少了機房基礎設施負擔,使得IT工作效能得到了極大提升。
(三)雙活容災從前文架構中可以看出,其基本實現了各條鏈路的高可用,不足之處是存儲為單一集中存儲,存在較為集中的單點風險。雖然通過vSphere的VDP功能以及第三方軟件,也可以實現虛擬機及數據文件的備份,但同樣需要額外的大容量存儲設備,并且無法做到實時同步備份。而銀行業往往是無法忍受數據存在丟失的可能性,因此,采取增購一臺與現有存儲同一型號的IBMV7000新存儲設備,利用V7000自帶的HyperSwap功能實現跨站點的存儲雙活災備架構,如圖2所示。1.建設目標通過IBMSVCHyperSwap技術,對新舊兩臺存儲進行實時容災建設,使得數據時刻存在一個在線的鏡像副本,當任意一份數據因為不可抗力產生物理損壞時,應用系統都可無感知無干預地進行平滑切換,保證數據不丟失及業務不間斷。2.實現方案及原理(1)HyperSwap功能提供高度可用的卷,可通過最遠相距300km的兩個站點進行訪問。在每個站點(兩臺存儲)上有維護數據的完全獨立副本,當主機在任一站點上寫入數據時,兩個副本會在寫入操作完成之前同步更新。此次實際項目中,由于兩臺存儲部署在同一物理機房內,因此無須考慮兩站點間長距離傳輸引起的網絡延遲問題。(2)在本次項目中,由于實際應用中,原本數據庫應用服務均是通過冷備方式進行切換的,沒有數據庫訪問的雙活,因此,在做存儲雙活災備的時候,無須考慮這一點。(3)如果任一站點上的節點或存儲脫機,HyperSwap功能會自動將應用訪問切換到另一站點的聯機副本,當故障站點恢復正常后,HyperSwap自動重新同步兩個副本。(4)通過IBMSVCHyperSwap實現對兩臺存儲系統上的磁盤進行鏡像后為服務器提供存儲。通過兩臺存儲陣列之間存儲鏡像如圖3所示。首先對兩臺存儲設備的物理磁盤做RAID5(對應圖中左右兩臺),然后在左邊存儲陣列中再劃分出LUNa和LUNb兩個邏輯磁盤,同樣,在右邊存儲陣列中可以劃分出LUN1和LUN2兩個邏輯磁盤,將這些LUNmap給SVC,SVC將這些LUN視為ManagedDisk,并在不同的ManagedDisk之間進行鏡像,做成供服務器使用的VirtualDisk。SVC或V7000將從左邊存儲的磁盤陣列獲得的Ma和從右邊存儲磁盤陣列獲得的M1進行鏡像后,形成的VirtualDisk為Vdisk1,然后再將Vdisk1map給主機服務器,主機服務器像使用本地磁盤一樣使用Vdisk1。對于主機服務器獲得的Vdisk來說,不會因為任何一個存儲系統的故障而出現問題,從而大大提高了存儲系統的可用性,為前端應用系統的開展提供了更好的保障。
三、監控管理
實現自動化的及時預警是運維工作中一項極其重要的事項,VMware虛擬化架構提供了內置的警報管理機制,預定義了很多基于集群、ESXi主機、虛擬機的警報,也可以自定義警報,主要包括:ESXi主機CPU電壓、溫度等狀態;虛擬機CPU利用率、內存使用率等;存儲空間的使用率告警;HA,FT等高級特征性錯誤。當以上告警觸發后,可配置vCenter發送SNMPtraps到專業網絡管理軟件中。目前,項目正在實施VMwarevSphere告警與本地zabbix特色監控平臺之間的對接,以更好地實現對報警事件的統一管理、及時響應和快速解決。vSphere企業管理組還可定期負責審查和管理這些有vCentre、虛擬機、ESXi主機產生的健康和系統日志,這些日志將為企業的保留策略及程序做準備和歸檔。
四、總結改進
本次虛擬化存儲雙活災備項目的實施,給分行帶來了高效可靠運維手段,但VMwarevSphere并非是一種萬能工具,“馬兒”再好,也要有善騎者才能駕馭,應重點注意以下兩點。一是高可靠性和高靈活度,帶來的是平臺高集中度的風險。VMwarevSphere內部機制是非常復雜的,科技人員應該不斷學習和掌握其特性,根據各自用戶的不同需求,進行長期的優化配置、調優性能,尤其要加強日常運維監控力度,注意收集和分析報警日志,防微杜漸,掌控其健康狀態、發展趨勢,及時采取有效的應對措施。二是強大的容錯保障機制,是以確保各項資源條件為前提的。運算資源和存儲資源應該嚴格做好科學規劃,重難點在于建立一套長期運營的規范并嚴格落實,杜絕隨意規劃、隨性申請、隨機分配,否則極易產生資源不平衡、擴展性差、配置混亂的情況。
參考文獻:
[1]王春海. VMware vSphere企業運維實戰[M]. 北京:人民郵電出版社,2017.
[2]朱金惟. 基于存儲虛擬化技術的雙活存儲系統設計與實現[J]. 信息與電腦,2017(1):137-138.
作者:陳恒 劉學梁 單位:興業銀行廣州分行