2020年10月9日,通過機房管理員巡檢發(fā)現(xiàn)發(fā)現(xiàn)華為云平臺系統(tǒng)計算節(jié)點服務(wù)器有硬件告警,隨后立刻聯(lián)系了機房硬件維保相關(guān)人員到現(xiàn)場處理故障。
硬件維保工程師到達現(xiàn)場后,發(fā)現(xiàn)日志顯示該服務(wù)器內(nèi)存條出現(xiàn)告警,需要關(guān)機處理。由于該服務(wù)器為華為云計算節(jié)點服務(wù)器,服務(wù)器上承載了一些其他業(yè)務(wù)系統(tǒng)的虛擬機,直接關(guān)機會導(dǎo)致業(yè)務(wù)中斷,所以維保工程師必須先將所有業(yè)務(wù)遷移至其他服務(wù)器,來確保關(guān)機后業(yè)務(wù)不受影響。
在華為云工程師的配合下,順利完成遷移后,硬件維保工程師對該服務(wù)器進行了關(guān)機下電操作,經(jīng)過測試發(fā)現(xiàn)該內(nèi)存條發(fā)生故障是因為內(nèi)存接觸不良,金手指上有氧化皮,擦拭金手指后重新將內(nèi)存條安裝到服務(wù)器,上電開機后,告警消除,業(yè)務(wù)恢復(fù)正常。
本次告警,于2020年10月9日上午發(fā)現(xiàn),2020年10月10日下午處理完畢,現(xiàn)已將本次故障處理增加到日常維護巡檢的手冊中,作為知識儲備。
通過本次操作,提高了維保人員對機房處理告警的效率、對硬件維護的水平,加強了自身操作水準,在未來工作里,藍牙數(shù)碼工作人員還將不斷進步,全面提升,更好的為客戶提供優(yōu)質(zhì)高效的服務(wù)。