華云·云場景應用詳解|疫情下硬件運維人員如何實現“遠程辦公”
華云·云場景應用詳解|疫情之下,硬件運維人員如何實現“遠程辦公”
新冠疫情防控,極大地改變了我們的生活方式,“遠程辦公”、“線上交流”的新型工作方式開始普及。對人力依賴極大的數據中心硬件設備運維是否也能搭上“遠程辦公”的便車,從容面對疫情變化,高效保障業(yè)務安全?安超DCM數據中心管理平臺利用帶外管理技術,與運維“打工人”一起探索遠程運維的可行性。
疫情下的硬件設備運維挑戰(zhàn)
2020年,在全球新冠疫情持續(xù)緊張的情況下,遠程辦公、在線網課、網購/團購等線上工作和生活方式開始普及,IT服務業(yè)迎來了爆發(fā)式增長,各行業(yè)數據中心IT硬件設備數量也隨之激增。由于疫情期間居家辦公,異地核算檢測導致出差不便等等原因,對幾乎全部依賴人力的數據中心硬件運維管理帶來了前所未有的挑戰(zhàn)。痛點總結如下:
1、設備數量成倍增加,品牌型號增多,管理復雜度指數級增長,經驗豐富的運維人員嚴重不足,人力成本大幅攀升;
2、居家辦公無法巡檢,設備故障發(fā)現不及時,安全隱患大;
3、日常資產管理和資產盤點工作無法開展,居家辦公無事可做;
4、異地出差受限,原廠支持難度增加,設備故障處理周期長,造成業(yè)務損失大;
5、數據中心全國分布,無高效遠程管理軟件,異地機房管理難度大。
帶外運維技術助力,硬件運維管理“遠程辦公”不是夢
數據中心硬件運維管理可分為帶外管理和帶內管理兩種管理模式。
(1)帶內管理
帶內管理,即監(jiān)控管理信息與生產數據信息使用同一物理通道進行傳送,主要是依賴于生產環(huán)境,如操作系統(tǒng),所提供的接口、驅動來獲取底層硬件的狀態(tài)(正常/故障)信息,從而實現監(jiān)測。帶內管理復用現有生產網絡,在每臺設備的系統(tǒng)層安裝Agent,然后將硬件監(jiān)控信息通過SNMP系統(tǒng)服務發(fā)送給帶內集中監(jiān)控平臺。
帶內管理示意圖
傳統(tǒng)的帶內管理及現場維護存在以下問題:
1、宿主機資源占用:帶內管理會消耗生產網絡帶寬,極端情況下可能會導致網絡資源耗盡,引發(fā)生產事件。Agent在宿主機上占用部分生產設備的CPU、內存資源,增加系統(tǒng)開銷。
2、現場維護:部署服務器、升級設備微碼、物理重啟設備等工作等都需在機房現場實施。極端情況下,如設備宕機故障,需要到現場實施手動物理重啟,導致生產事件問題處理滯后。
3、Agent版本維護困難:目前數據中心多數為混合架構,生產環(huán)境包含Linux、Windows、ESX、AIX、Solaris、docker等不同平臺眾多版本,帶內管理Agent版本、兼容性維護工作量大。
4、不符合安全監(jiān)管要求:部分監(jiān)控Agent會用到特殊的系統(tǒng)服務及端口,會和生產環(huán)境某些應用沖突(如JDK版本不一致、系統(tǒng)端口沖突等)。在安全等保要求較高的情況下,Agent的使用不符合安全管理規(guī)范。
(2)帶外管理
帶外管理主要是通過專門的網管通道實現對硬件設備狀態(tài)數據的獲取,與生產業(yè)務網絡相隔離,其核心原理在于通過不同的物理通道傳送管理數據和生產數據,兩者互相獨立,互不影響。
帶外管理示意圖
帶外管理使用了IPMI協議,通過基板管理控制器(BMC)進行交流,通過在設備內部的傳感器對硬件進行智能管理。無需通過操作系統(tǒng)進行管理,允許進行帶外服務器管理,生產網絡也無需負擔硬件狀態(tài)監(jiān)控數據的傳輸任務。用戶可以利用IPMI監(jiān)視服務器的物理狀態(tài)數據,如溫度、電壓、風扇工作狀態(tài)、電源供應以及機箱入侵等數據。帶外管理最大的優(yōu)勢在于它是獨立于計算芯片CPU、主板IO控制系統(tǒng)BIOS和操作系統(tǒng),可以實現在開/關機狀態(tài)下,接通電源就即可以對硬件設備的監(jiān)控管理。
(3)帶內管理與帶外管理對比
啟動帶外管理“遠程辦公”模式
安超DCM數據中心管理平臺運用帶外管理技術搭建的跨廠商、跨硬件平臺的統(tǒng)一帶外管理平臺,可以實現自動化巡檢、遠程資產管理與資產盤點、統(tǒng)一vKVM遠程管理,實現運維人員不在數據中心現場,也能對數據中心設備情況盡在掌握。
總結
相較于傳統(tǒng)的帶內管理,帶外管理技術是一種更安全、更智能、更高效的數據中心硬件設備統(tǒng)一運維管理方式,安超DCM能夠助力數據中心提升智能化運維程度、加強運維的數據支撐,從而全面降低運維難度、減少人工依賴、實現多數據中心遠程聯動管理,可見,帶外管理技術的應用成功讓數據中心運維人員“遠程辦公”成為現實,疫情還未完全散去,我們還需未雨綢繆。