今年7月,隨著列車自動(dòng)監(jiān)控及運(yùn)營調(diào)度指揮系統(tǒng)的成功上線,某市地鐵14號線核心系統(tǒng)無感升級改造工作順利完成,標(biāo)志著全國首個(gè)“軌道交通基于雙網(wǎng)段架構(gòu)部署的列車自動(dòng)控制系統(tǒng)國產(chǎn)化整體解決方案”成功落地。
作為數(shù)據(jù)庫產(chǎn)品及配套服務(wù)提供商,人大金倉于2021年7月起開展方案中數(shù)據(jù)庫的整體建設(shè)工作。作為軌道交通的核心業(yè)務(wù)系統(tǒng)之一的列車自動(dòng)監(jiān)控及運(yùn)營調(diào)度指揮系統(tǒng)的國產(chǎn)化落地尤其值得關(guān)注。
粒度有限的高可用(升級前)
01現(xiàn)行數(shù)據(jù)庫高可用架構(gòu) 對故障轉(zhuǎn)移支撐粒度有限
由于原系統(tǒng)采用Oracle DG一主兩備集群,需要第三方仲裁Observer觀察程序(OCI客戶端組件),才能完成自動(dòng)故障轉(zhuǎn)移,另外Observer觀察程序又部署在Oracle DG備庫服務(wù)器上,該服務(wù)器故障將引起連鎖反應(yīng),導(dǎo)致現(xiàn)有數(shù)據(jù)庫高可用架構(gòu)支持有限功能的故障轉(zhuǎn)移。
02傳統(tǒng)雙網(wǎng)方案與IT環(huán)境緊耦合 存在性能損耗,用戶體驗(yàn)差
雙網(wǎng)方案利用外部IT環(huán)境實(shí)現(xiàn),形成了雙網(wǎng)卡綁定、域名到多個(gè)IP的映射、Windows服務(wù)等多種傳統(tǒng)雙網(wǎng)方案,雙網(wǎng)卡綁定需要交換設(shè)備的支持、域名到多個(gè)IP的映射需要DNS服務(wù)器、利用Windows服務(wù)要求數(shù)據(jù)庫集群必須部署在Windows端,在任意一個(gè)網(wǎng)絡(luò)異常的情況下,傳統(tǒng)雙網(wǎng)方案與IT環(huán)境緊耦合,網(wǎng)卡切換依賴操作系統(tǒng)協(xié)議轉(zhuǎn)換,存在性能損耗,導(dǎo)致業(yè)務(wù)切換體驗(yàn)差,后期通用性差、運(yùn)維困難。
03 緊急故障恢復(fù) 便捷易用度亟待提高
原系統(tǒng)Oracle DG集群主庫發(fā)生故障,DG備庫升為主庫,一旦原主庫從宕機(jī)、斷網(wǎng)等崩潰中恢復(fù),在進(jìn)行故障轉(zhuǎn)移之前需要在數(shù)據(jù)庫上啟用“閃回?cái)?shù)據(jù)庫”,且該數(shù)據(jù)庫上必須有所需的閃回日志,才能手動(dòng)將原主庫恢復(fù)為備庫,形成新的Oracle DG主備集群,緊急故障恢復(fù)便捷易用性難以滿足軌道交通行業(yè)需求。
極致高可用(升級后)
架構(gòu)升級,萬無一失
由于原系統(tǒng)Oracle DG主備集群需要依賴第三方仲裁程序Observer,才能實(shí)現(xiàn)故障自動(dòng)轉(zhuǎn)移,加之第三方仲裁程序Observer部署在DG備庫服務(wù)器所帶來的關(guān)聯(lián)影響,現(xiàn)有數(shù)據(jù)庫高可用架構(gòu)對故障轉(zhuǎn)移支持粒度有限。
金倉KES數(shù)據(jù)庫主備集群架構(gòu)升級,內(nèi)置自選主協(xié)議的高可用組件,保證了2F+1的容錯(cuò)能力,即2F+1個(gè)節(jié)點(diǎn)的系統(tǒng)最大允許F個(gè)節(jié)點(diǎn)同時(shí)出現(xiàn)故障。更進(jìn)一步,該協(xié)議具備自仲裁,自選主能力,使得金倉KES數(shù)據(jù)庫集群,在高可用方面可進(jìn)一步得到增強(qiáng):
1.通過自仲裁、自選主組件,更及時(shí)發(fā)現(xiàn)故障、更迅速故障自動(dòng)切換,極大縮短RTO時(shí)間。
2.可控的選主算法自降級策略,充分保障系統(tǒng)可用性。
新雙網(wǎng)方案,全場景覆蓋,極致故障切換體驗(yàn)
為了保證雙網(wǎng)方案具有較好的業(yè)務(wù)切換體驗(yàn),實(shí)現(xiàn)IT環(huán)境解耦,新雙網(wǎng)方案通過數(shù)據(jù)庫主備集群支持雙網(wǎng)段環(huán)境下的高可用性,數(shù)據(jù)庫直接接管雙網(wǎng)卡,任意一個(gè)網(wǎng)絡(luò)異常的情況下,網(wǎng)卡切換不依賴操作系統(tǒng),沒有協(xié)議轉(zhuǎn)換,性能損耗降到最低,完全滿足軌道交通5秒內(nèi)完成雙網(wǎng)切換的高可用需求。
新雙網(wǎng)方案在應(yīng)用訪問方面實(shí)現(xiàn)了網(wǎng)絡(luò)高可用:
1.客戶端應(yīng)用透明訪問的NDP和JDBC驅(qū)動(dòng)程序支持多網(wǎng)絡(luò)地址的連接、尋址、可識別主備狀態(tài);
2.NDP和JDBC驅(qū)動(dòng)支持在雙網(wǎng)環(huán)境下客戶端應(yīng)用連接數(shù)據(jù)庫主備高可用集群,在數(shù)據(jù)庫主備切換和單個(gè)網(wǎng)絡(luò)故障時(shí),支持秒級業(yè)務(wù)切換。
3.新雙網(wǎng)方案在數(shù)據(jù)庫主備集群數(shù)據(jù)復(fù)制方面和集群HA管理方面實(shí)現(xiàn)了網(wǎng)絡(luò)高可用:
4.數(shù)據(jù)庫集群主備數(shù)據(jù)同步協(xié)議支持多IP地址尋址;
5.數(shù)據(jù)庫主備集群組件(HA)支持多IP地址尋址;
6.在任意一個(gè)網(wǎng)絡(luò)異常的情況下,仍可以找尋可用的網(wǎng)絡(luò)進(jìn)行通信,而不會(huì)觸發(fā)集群間的故障轉(zhuǎn)移,從而保證數(shù)據(jù)庫集群的正常運(yùn)行;
7.當(dāng)數(shù)據(jù)庫主機(jī)發(fā)生故障時(shí),集群自動(dòng)切換至備用節(jié)點(diǎn)。
人大金倉數(shù)據(jù)庫架構(gòu)已全面實(shí)現(xiàn)插件化解耦,本次項(xiàng)目升級建設(shè)采用數(shù)據(jù)庫雙網(wǎng)插件,避免侵入數(shù)據(jù)庫內(nèi)核,保證數(shù)據(jù)庫內(nèi)核穩(wěn)定性,簡化了應(yīng)用開發(fā)、運(yùn)維,為系統(tǒng)升級和功能迭代奠定了堅(jiān)實(shí)基礎(chǔ):
緊急故障,自動(dòng)恢復(fù)
原系統(tǒng)Oracle DG集群主庫喪失能力,備庫升為主庫后,要成功恢復(fù)原主數(shù)據(jù)庫,需要在故障轉(zhuǎn)移之前在數(shù)據(jù)庫上啟用“閃回?cái)?shù)據(jù)庫”,且該數(shù)據(jù)庫上必須有所需的閃回日志,才能手動(dòng)將原主庫恢復(fù)為備庫,形成新的Oracle DG主備集群,緊急故障恢復(fù)便捷易用度亟待提高。
金倉KES數(shù)據(jù)庫主備集群架構(gòu)升級,并支持特定場景的深度定制開發(fā),從而具備了緊急故障自動(dòng)恢復(fù)的能力,大幅提升了運(yùn)維人員的便捷易用性體驗(yàn):
金倉KES數(shù)據(jù)庫主備集群主庫宕機(jī),備庫升為主庫后,新主庫將自動(dòng)對原故障主庫進(jìn)行恢復(fù)(例如此時(shí)原主庫已恢復(fù)供電或解決了設(shè)備癱瘓問題)。在業(yè)務(wù)恢復(fù)期間,新主庫始終對外提供服務(wù),恢復(fù)過程對用戶無感,RTO/RPO=0!。
行業(yè)試點(diǎn),服務(wù)全國
人大金倉持續(xù)在軌道交通行業(yè)大力布局,與國內(nèi)領(lǐng)先的提供全生命周期管家式服務(wù)的軌道交通整體解決方案供應(yīng)商深度合作,為軌道交通列車自動(dòng)控制系統(tǒng)(ATS)的實(shí)時(shí)運(yùn)行數(shù)據(jù)和系統(tǒng)配置數(shù)據(jù)提供極致高可用的數(shù)據(jù)存儲(chǔ)與計(jì)算支撐。項(xiàng)目已在某市試點(diǎn)上線,后續(xù)將陸續(xù)在29個(gè)城市進(jìn)行行業(yè)推廣,人大金倉將提供以全國各省為單位的7*24小時(shí)響應(yīng)的本地化原廠實(shí)施和售后服務(wù)。
總結(jié)展望
人大金倉作為數(shù)據(jù)庫領(lǐng)域?qū)I(yè)廠商,深知硬核能力是破局之道,新技術(shù)應(yīng)用是發(fā)展之源,契合行業(yè)需求是生存之基。通過為用戶提供優(yōu)質(zhì)的數(shù)據(jù)庫產(chǎn)品與服務(wù),助力軌道交通行業(yè)基于雙網(wǎng)段標(biāo)準(zhǔn)的列車自動(dòng)控制系統(tǒng)國產(chǎn)化創(chuàng)新升級。驅(qū)動(dòng)軌道交通行業(yè)國產(chǎn)化升級的高質(zhì)量發(fā)展。