為TCO和PUE而生:英特爾HTA數(shù)據(jù)中心戰(zhàn)略全解析
將空調和UPS從數(shù)據(jù)中心中搬離出去,這真是一個瘋狂的決定,會使很多運營工程師和高管們坐立不安;但這又是一個很明智的決定,因為這會省下大筆的購置和運營成本,顯著降低數(shù)據(jù)中心的PUE和TCO。
有沒有一個更好的辦法,既要工程師們安心享受愜意的周末時光,又要精明的老板們減少開支,當然還要符合國家節(jié)能減排的大政策環(huán)境。老實說,現(xiàn)在還沒有一個簡單可行的操作方案。不過,有些廠商已經開始嘗試著往這個方面走,并且推出了不少解決方案。
作為數(shù)據(jù)中心行業(yè)內的最底層解決方案供應商,英特爾也一直在這方面進行嘗試。比如允許服務器工作在更高溫度環(huán)境中,改變服務器的供電方式和電池備份,加強對數(shù)據(jù)中心IT基礎設施的監(jiān)控能力,做到應用負載與能耗的相匹配,提高IT設備的使用效率。
在這所有的方案中,高溫數(shù)據(jù)中心是特別值得研究的,因為這是釜底抽薪的招數(shù)。從現(xiàn)在數(shù)據(jù)中心的整體能耗組成比例中,IT基礎設施、環(huán)境制冷和UPS是三塊最大的開支。而制冷則是遵守能量守恒定律,主要是為了解決IT設備在運行中產生的熱量,而UPS則是為了保證IT設備的工作連續(xù)性。
接下來,就讓我們來詳細了解一下英特爾所推出的HTA數(shù)據(jù)中心。HTA是High Ambient Temperatures的縮寫,中文直譯是高環(huán)境溫度。英特爾希望通過通過提升數(shù)據(jù)中心工作溫度,減少冷卻系統(tǒng)的能源消耗,最大化的節(jié)約能源,并且降低整體數(shù)據(jù)中心的PUE。
HTA并不是一套完完全全的新技術,而是一個多種技術的組合式解決方案。從單一晶體管到與處理器、服務器平臺、數(shù)據(jù)中心、以及輸配電網絡,它已發(fā)展出一整套技術。
首先是數(shù)據(jù)中心氣流組織,英特爾采用了目前流行的冷熱通道隔離技術。目前,仍然有部分數(shù)據(jù)中心在機柜放置方面不是很合理,這就造成了機房中局部熱點的出現(xiàn);同時,冷熱通道混雜也提高了機房整體溫度環(huán)境,而機房級的制冷則需要消耗更多的能源。
其次是自然冷源的引入,通過引入自然環(huán)境的冷空氣來為IT設備降溫。比如,谷歌將規(guī)模龐大的數(shù)據(jù)中心建設在靠近北極圈的北歐地區(qū),就是為了引入自然冷源。通常業(yè)界認為,自然冷源屬于上帝的恩賜,只能在高緯度地區(qū)才可能應用;但英特爾的研究發(fā)現(xiàn),即使是在中低緯度地區(qū),在晝夜溫差較大的情況下,依然可以通過引入自然冷源來進行降溫。
第三是引入英特爾所推出的Node Manager以及Data Center Manager等管理軟件,這些軟件可以監(jiān)控每一臺服務器功耗,并且給出精確和詳盡的報告;同時,為了保證業(yè)務連續(xù)性,當數(shù)據(jù)中心市電中斷時,根據(jù)業(yè)務情況,能夠通過降低功耗的手段來延長續(xù)航時間,保障企業(yè)業(yè)務受到最小的影響。而Power Thermal Aware Scheduling (PTAS) 技術可以幫助數(shù)據(jù)中心智能分析運算量、功耗和溫度,通過分析各個服務器負載情況,將運算量在不同機柜上進行調度,來盡量杜絕局部熱點的出現(xiàn)。
第四,英特爾還為用戶提供了Battery Backup Solution解決方案,這套方案能夠為數(shù)據(jù)中心提供電池備份,這樣可以省去UPS的一筆不少開支,同時也是確保業(yè)務連續(xù)性的有效手段。其工作原理與UPS基本一致,也就是在市電中斷一直到備用油機全部加載之間,有效保護業(yè)務連續(xù)性。
第五,也是整體解決方案中最為關鍵的一環(huán):通過使得服務器可以安全有效的工作在更高的溫度環(huán)境下,比如說現(xiàn)在普遍的運行環(huán)境是18--21℃。如果將環(huán)境溫度提升到25-27度,服務器和存儲仍然能夠保證工作,但隨之而來的是巨大的能源節(jié)約。當然,這主要歸功于英特爾在服務器領域內的主打產品至強系列芯片。從至強5600開始,更先進的制程工藝,更加智能的功率匹配,都可以有效幫助降低能耗。
毋庸置疑,HTA將會給用戶帶來多大的價值。但為什么目前依然是“曲高和寡”,因為用戶的疑慮是非常明顯的,HTA會不會降低可靠性和穩(wěn)定性?
從服務器和數(shù)據(jù)中心的工作原理上來看,伴隨著溫度的升高,部分IT設備可靠性降低是必然的。所以,HTA數(shù)據(jù)中心并不是適合所有的應用場景,比如在追求極致性能的HPC領域。正如英特爾亞太區(qū)數(shù)據(jù)中心事業(yè)部雷科夫所說:“HTA數(shù)據(jù)中心更加適合那些對于性價比高度重視的用戶,他們追求的不是極致性能,也不是絕對穩(wěn)定可靠,而是最低的TCO。用戶完全可以把在構建和運營HTA數(shù)據(jù)中心過程中節(jié)省的成本,用于購置更多的IT設備,通過增加設備冗余來提升可靠性。”
目前,主流服務器廠商都能夠提供一些可以在高溫環(huán)境下的相關產品,用戶已經有了更多的選擇。“接下來,英特爾將會和更多的ODM/OEM廠商進行合作,加快新產品的推出,也會通過ODCA等行業(yè)組織進行更多的推廣和宣傳。”
用戶需要改變的是什么呢?認識,傳統(tǒng)的認識,花費更少的成本,得到同樣的穩(wěn)定性和可靠性,何樂而不為呢?