
攜程在聲明中說,攜程后臺是一個由SOA(面向服務(wù))架構(gòu)組成的龐大服務(wù)器集群,看似簡單的一個頁面背后由上千個應(yīng)用子系統(tǒng)以及上千個Web Service組成,而每個應(yīng)用子系統(tǒng)和每個Web Service之間都存在著相互調(diào)用的依賴關(guān)系。發(fā)生事件后,攜程的技術(shù)人員除了需要恢復(fù)生產(chǎn)服務(wù)器上的執(zhí)行代碼以外,還需要做的是恢復(fù)并確保每個應(yīng)用子系統(tǒng)以及每個Web Service的功能正常,同時確保應(yīng)用子系統(tǒng)與Web Service間的調(diào)用關(guān)系得以正常執(zhí)行。因此才花費(fèi)了十二個多小時才恢復(fù)正常。
攜程稱,數(shù)據(jù)和數(shù)據(jù)庫并未受到此次事件的影響,用戶訂單數(shù)據(jù)也完整無損。
對于該員工后續(xù)如何處理,攜程方面暫未表態(tài)。
以下為攜程的簡要原因說明:
1、事件發(fā)生原因
經(jīng)攜程技術(shù)排查,確認(rèn)此次事件是由于員工錯誤操作,刪除了生產(chǎn)服務(wù)器上的執(zhí)行代碼導(dǎo)致。
2、為什么恢復(fù)時間那么長
一般來說,類似攜程這樣的大型網(wǎng)站承載著繁多業(yè)務(wù),其后臺是一個由SOA(面向服務(wù))架構(gòu)組成的龐大服務(wù)器集群,看似簡單的一個頁面背后由上千個應(yīng)用子系統(tǒng)以及上千個Web Service組成,而每個應(yīng)用子系統(tǒng)和每個Web Service之間都存在著相互調(diào)用的依賴關(guān)系。
發(fā)生事件后,攜程的技術(shù)人員除了需要恢復(fù)生產(chǎn)服務(wù)器上的執(zhí)行代碼以外,還需要做的是恢復(fù)并確保每個應(yīng)用子系統(tǒng)以及每個Web Service的功能正常,同時確保應(yīng)用子系統(tǒng)與Web Service間的調(diào)用關(guān)系得以正常執(zhí)行。
這種驗(yàn)證性的操作需要攜程的工程師及運(yùn)維人員通力合作,盡快恢復(fù)生產(chǎn)代碼并通過反復(fù)地、持續(xù)性地調(diào)試以確保應(yīng)用子系統(tǒng)與Web Service功能的正常運(yùn)行。
攜程再次保證,數(shù)據(jù)和數(shù)據(jù)庫并未受到此次事件的影響,用戶訂單數(shù)據(jù)也完整無損,請用戶放心并繼續(xù)使用攜程網(wǎng)站及App。
3、如何杜絕此類事件的再次發(fā)生?
攜程在系統(tǒng)上做了改進(jìn),規(guī)范并杜絕技術(shù)人員錯誤刪除生產(chǎn)服務(wù)器上代碼的操作。
推薦閱讀
攜程回應(yīng)官網(wǎng)癱瘓:數(shù)據(jù)沒丟失 預(yù)訂數(shù)據(jù)保存完整
每日經(jīng)濟(jì)新聞記者 夏冰 發(fā)自上海 “在攜程APP上買機(jī)票買了一半網(wǎng)頁跳出說系統(tǒng)異常,最后發(fā)現(xiàn)是整個APP都出問題了。”今日(5月28日)中午12點(diǎn)開始,多位網(wǎng)>>>詳細(xì)閱讀
本文標(biāo)題:攜程解釋癱瘓原因:員工錯誤操作 刪除服務(wù)器執(zhí)行代碼
地址:http://www.geekbao.cn/a/daohang/20150529/296279.html