任何網絡系統(tǒng)都有出現(xiàn)故障的時候,可能發(fā)生在測試階段,也可能發(fā)生在系統(tǒng)剛剛上線,還可能發(fā)生在已經穩(wěn)定運行很多年的系統(tǒng)上。這些系統(tǒng)出現(xiàn)故障所帶來的負面影響可大可小,小到一個終端的軟件無法使用,大到整個網絡癱瘓……
網絡突發(fā)問題的例子比比皆是,2012年的雙十一凌晨剛過,在第1分鐘內,全國有超過1000萬名獨立客戶“涌入”淘寶,淘寶總部的網絡一度陷入癱瘓,遭到了網友們詬病,支付寶被”搶癱”,好不容易進入支付過程,支付寶提示系統(tǒng)繁忙,經過反復嘗試,花費用戶很長時間實現(xiàn)支付。而京東當天流量暴漲,大量用戶登錄。結果京東商城的服務器被大流量沖垮,服務器也癱瘓。
作為以網絡為主體的公司,難免會碰到各種各樣的網絡突發(fā)問題,如何解決這些問題已經成為所有企業(yè)都關注話題。本期IT大智慧就讓筆者帶大家了解一下常見網絡突發(fā)問題的解決方案。
硬件損壞
服務器硬件故障是導致企業(yè)網絡突發(fā)問題最大原因之一,由于X86服務器和臺式機有著很多相似之處,無論是從前期部署、中期維護到后期管理都有著不少相同點。因此,X86服務器盡管有著成熟穩(wěn)定的架構體系,也不免出現(xiàn)“罷工”。特別是企業(yè)負載應用得多了,遇到的故障是很平常的事情。較為常見的服務器硬件故障有處理器故障、內存故障、硬盤故障、線纜連接故障、電源、管理模塊以及網卡故障等。而解決這些故障最簡單的辦法就是選擇一些品牌質量過硬,服務較好的廠商.
目前,像戴爾PowerEdge 12G系列、聯(lián)想ThinkServer系列,IBM System系列、HP ProLiant系列都能為企業(yè)用戶提供經久耐用的產品,當然如果您的企業(yè)資金較為緊張,也可選用曙光等國產品牌服務器來滿足您的需求。
而服務方面,能夠提供金牌服務的戴爾應該算是最讓人省心的服務器品牌,以戴爾PowerEdge 12G系列為例,其支持3年專業(yè)支持和 (7x24) 4小時上門服務和安裝Dell PowerEdge服務器、Microsoft Windows操作系統(tǒng)服務,能夠以最專業(yè)的服務和最快捷的上門服務快速解決企業(yè)用戶服務器問題。
高溫宕機
不少中小企業(yè)服務器由于需要控制成本并沒有在機房托管,這也就帶來一些不穩(wěn)定因素,比如機房溫度、斷電、瞬間電流過大等情況。筆者認識一位IT運維人員,其在某企業(yè)擔任系統(tǒng)工程師職位,在前不久,該公司發(fā)生了一次較大故障,故障成因很簡單,就是由于空調物理機損壞,導致多臺服務器過熱,部分業(yè)務中斷。在更換新的空調之后問題得以解決。當然,在沒有更換之前,當時也采用了一些"笨辦法",比如使用大功率的風扇、開啟機房的排氣窗等等,暫時緩解了空調損壞造成的不良影響。
出現(xiàn)故障的同時必然會造成一些業(yè)務的中斷,可想而知,若是故障得不到及時的處理,那么公司網絡將會處在一個"癱瘓"的狀態(tài),這將是很可怕的事情,后果不堪設想。那么如何解決類似于高溫宕機這樣的問題呢?
對于類似故障處理,大概遵循以下幾個大的方向。首先,機房中應安裝有溫度報警系統(tǒng),溫度達到閥值后會直接報告給相關運維人員;其次需要IT運維人員收到報警巡檢或定期巡檢;再次,IT運維人員應檢查是否誤報;在確認報警內容屬實進行相應處理;最后檢查是否有預案,如有則按照預案處理,如無則盡快聯(lián)系廠商處理,同時對此事備案。
在處理問題環(huán)節(jié),如果在自身團隊無法處理的時候,會及時和廠商聯(lián)系,獲取更專業(yè)的支持。
以戴爾新風冷卻解決方案為例,其不僅具備高散熱能力和可靠性等優(yōu)勢,還使得方案中的服務器、存儲和網絡設備允許用戶在更高溫度條件下安全、穩(wěn)定的運行,避免因高溫宕機“罷工”。
瞬間高流量壓力
就像本篇一開始所說,由于瞬間流量過高導致的服務器宕機的例子比比皆是,就連耗資三億多12306購票網站也在春節(jié)、國慶前后出現(xiàn)宕機意外,據不完全統(tǒng)計,每年春運時間僅鐵道客運流量便高達4億人次,如此高的瞬間流量難免讓一個網站無法承受。
既然是全國交通購票系統(tǒng)網站,由國家鐵道部親自操刀主辦,又投入如此大的經費,每每關鍵時刻出現(xiàn)問題,很多時候不得不讓人心存疑慮。從技術角度而言,也許是因為服務器數(shù)量不足,技術不夠完善等等。若說這一網站真正發(fā)揮功效的時候可謂屈指可數(shù),十一和春節(jié)是中國最為重要的兩個節(jié)日,也是人們出行高峰時節(jié),但僅僅因為服務器數(shù)量原因而增加設備,難免在年中其它時間顯得浪費。下面就讓我們來一起看看網站瞬間高流量壓力問題應如何解決。
首先我們先來熟悉一下這兩個名詞:負載均衡、應用交付。