近日,IDC在《關(guān)鍵業(yè)務(wù)平臺(tái)以業(yè)務(wù)連續(xù)性助力“數(shù)字優(yōu)先”戰(zhàn)略》(Mission-Critical Platforms Deliver Continuity in the Shift to "Digital First" Strategies)報(bào)告中授予HPE Superdome Flex系列服務(wù)器AL4級(jí)別的可用性評(píng)價(jià),并指出“HPE是AL4級(jí)市場(chǎng)的主要參與者”。
HPE Superdome Flex 系列服務(wù)器正是如此,基于RAS策略進(jìn)行設(shè)計(jì),可靠性(Reliability)、可用性(Availability)和可維護(hù)性(Serviceability)目標(biāo)都得到了實(shí)現(xiàn),具體行動(dòng)步驟包括:
1. 通過(guò)檢測(cè)和記錄錯(cuò)誤來(lái)確定出現(xiàn)的故障。
2. 對(duì)故障進(jìn)行分析,防止其影響到更高 級(jí)別的IT堆棧,如操作系統(tǒng)、數(shù)據(jù)庫(kù)、應(yīng)用程序和數(shù)據(jù)等。
3. 修復(fù)故障來(lái)減少或避免停機(jī)。
此次IDC授予HPE Superdome Flex系列服務(wù)器AL4級(jí)評(píng)價(jià),也充分肯定了其較高水準(zhǔn)的RAS能力——稱(chēng)HPE Superdome Flex系列服務(wù)器是具有容錯(cuò)能力的平臺(tái),在任何情況下都能連續(xù)地運(yùn)行,具有覆蓋整個(gè)系統(tǒng)的硬件RAS和硬件冗余功能。
具體來(lái)看,HPE Superdome Flex的RAS功能體現(xiàn)在以下三方面:
使用RAS功能跨子系統(tǒng)進(jìn)行錯(cuò)誤檢測(cè)
在較低的IT層級(jí)使用子系統(tǒng)RAS功能,來(lái)收集證據(jù)以檢測(cè)錯(cuò)誤、確定根本原因并找到錯(cuò)誤之間的相關(guān)性。其中,內(nèi)存RAS技術(shù)可增強(qiáng)內(nèi)存可靠性并降低內(nèi)存中斷率。
Platform RAS提供自適應(yīng)路由,能夠在系統(tǒng)發(fā)生故障處或故障鏈路周?chē)酚闪髁?。HPE Superdome Flex服務(wù)器由英特爾®至強(qiáng)®可擴(kuò)展處理器提供支持,具備了完整RAS功能,包括創(chuàng)新的錯(cuò)誤檢測(cè)和重試機(jī)制。
固件優(yōu)先阻止錯(cuò)誤影響操作系統(tǒng)和應(yīng)用程序
內(nèi)存、CPU或I/O通道中發(fā)生的錯(cuò)誤將停留在固件級(jí)別。固件可以收集錯(cuò)誤數(shù)據(jù)并進(jìn)行診斷,即使在處理器未完全正常工作的情況下,診斷仍能正常進(jìn)行,可針對(duì)系統(tǒng)內(nèi)存、CPU、I/O和互連組件進(jìn)行預(yù)測(cè)性故障分析
分析引擎對(duì)故障進(jìn)行處理和糾正
分析引擎持續(xù)地對(duì)所有硬件進(jìn)行故障分析。它可以預(yù)測(cè)故障,還能啟動(dòng)自動(dòng)恢復(fù)功能,并將問(wèn)題及時(shí)告知系統(tǒng)管理員和管理軟件,進(jìn)一步減少了人為錯(cuò)誤的發(fā)生,并提高了系統(tǒng)的可用性。