“沒有電源就沒有AI”,英飛凌談AI服務器的供電架構變革
生成式AI的爆發(fā)式增長正重塑數(shù)據(jù)中心生態(tài),供電系統(tǒng)成為支撐算力革命的基石。據(jù)國際能源署(IEA),2023至2030年間,數(shù)據(jù)中心能耗將激增165%,而AI服務器機架功耗已從10kW飆升至120kW以上,單GPU功耗甚至逼近2kW。這種高功率密度需求對電源效率、散熱設計和可靠性提出前所未有的挑戰(zhàn)。
作為全球功率半導體領導者,英飛凌科技(InfineonTechnologies)憑借碳化硅(SiC)、氮化鎵(GaN)和垂直供電(VPD)等關鍵技術,引領AI服務器電源架構變革。
“面對AI運算耗電比例的不斷上升,提升電源效率與功率密度已成為當務之急。也可以說‘沒有電源就沒有AI’,這充分體現(xiàn)了電源在AI系統(tǒng)中的重要性?!?
近日21ic有幸采訪到了英飛凌消費、計算與通訊業(yè)務大中華區(qū)服務器電源應用市場經(jīng)理陳世偉,他深入剖析了AI數(shù)據(jù)中心供電技術的痛點與未來,揭示英飛凌如何通過創(chuàng)新器件和系統(tǒng)級解決方案賦能AI時代。
英飛凌消費、計算與通訊業(yè)務大中華區(qū)服務器電源應用市場經(jīng)理陳世偉
21ic:AI服務器相較傳統(tǒng)服務器的電源需求有何獨特要求?高功率密度如何影響電源設計?英飛凌的芯片如何助力高功率PSU實現(xiàn)高效能?
AI服務器通常需要更高的功率來支持其高性能計算和處理能力,這是由于它們需要運行復雜的算法和處理大量數(shù)據(jù)。
與傳統(tǒng)服務器相比,AI服務器的電源要求有幾個關鍵差異。首先,AI服務器通常需要更高的功率來支持龐大的算力,如GPU和TPU。這些組件需要更多的電力來運行,這使得電源的設計變得更加復雜。其次,AI服務器通常需要更高的效率和可靠性,因為它們需要24/7運行并處理大量數(shù)據(jù)。最后,AI服務器的電源需要能夠適應不斷變化的負載和功率需求,這使得電源的設計需要更加靈活和可擴展。
(圖片來源于IEA)
高功率需求對電源的設計有著重大影響。首先,電源需要能夠提供更高的電壓和電流,這需要更高的功率密度和更高效的設計。其次,電源需要能夠處理高功率下產(chǎn)生的熱量,這需要更好的散熱設計。最后,電源需要能夠提供更高的可靠性和冗余性,以確保AI服務器的正常運行。
英飛凌的芯片可以支持更高功率的PSU(電源)通過提供高效和可靠的功率管理解決方案。此外, 英飛凌除了可以提供傳統(tǒng)MOSFET外,也提供SiC、IGBT、GaN 等不同的功率器件。面對目前高功率密度的要求,英飛凌能夠采用合適的器件,有效提升功率密度,從而使電源的設計更加緊湊和高效。同時,英飛凌的控制器和驅動器可以提供高精度和高可靠性的功率管理功能,這使得電源的設計更加穩(wěn)定和可靠。
(圖片來源于英飛凌官網(wǎng))
21ic:BBU(備用電池單元)在AI服務器瞬時斷電保護中的作用日益重要,電源芯片需要在哪些方面加強,才能提升BBU的快速響應和可靠性?
除了在電源架構方面的革新,考慮到AI服務器如果發(fā)生斷電可能付出的代價(每小時停機損失可達100萬至500萬美元),英飛凌也公布了一套完整的AI數(shù)據(jù)中心電池備用單元模塊(BBU)產(chǎn)品發(fā)展藍圖,涵蓋4kW到12kW方案,具備高效率與可靠、可擴充的電源轉換能力,以及高出業(yè)界平均水平四倍的功率密度。在確保供電不間斷之外,BBU還能夠提供過濾和調節(jié)電源供應的功能,保護敏感的AI運算硬件免受電壓突波、浪涌等電源異常情況的沖擊。
(圖片來源于英飛凌官網(wǎng))
其中,5.5kW BBU采用英飛凌獨家拓撲結構結合Si與GaN技術,而業(yè)界首創(chuàng)的12 kW系統(tǒng)則配備多張4 kW電源轉換卡,搭載英飛凌PSOC微控制器、40V與80V OptiMOS以及EiceDRIVER柵極驅動器。
21ic:液冷成為AI服務器趨勢,AI服務器中的電源需要和散熱系統(tǒng)進行協(xié)同設計。請問英飛凌的芯片如何適配高功率電源系統(tǒng)的熱管理需求?
根據(jù)國際能源署(IEA)數(shù)據(jù),數(shù)據(jù)中心目前占全球能耗的2%。隨著AI發(fā)展加速,預計在2023至2030年間,數(shù)據(jù)中心的電力需求將增長165%。因此,提升從電網(wǎng)到主板核心的電源轉換效率與功率密度,是進一步提高計算性能并降低總擁有成本(TCO)的關鍵。
(圖片來源于IEA)
*創(chuàng)新的OptiMOS? TDM2454xx四相功率模塊*
OptiMOS? TDM2454xx四相功率模塊實現(xiàn)了真正的垂直供電(VPD),并提供行業(yè)領先的2安培/平方毫米電流密度。該模塊延續(xù)了英飛凌去年推出的OptiMOS? TDM2254xD和TDM2354xD雙相功率模塊,為加速計算平臺提供卓越的功率密度。
(圖片來源于英飛凌官網(wǎng))
在傳統(tǒng)水平供電系統(tǒng)中,電流在電路板到ASIC之間流動時,會因為電流經(jīng)過PCB路徑而產(chǎn)生傳導損耗。隨著ASIC電源需求的增加,電流的提升會導致明顯的功率損耗。然而,垂直供電可以大幅縮短傳輸路徑,降低傳導損耗,從而提升系統(tǒng)性能。
這種改進的關鍵在于減少電流通過的阻抗,垂直供電設計通常能夠實現(xiàn)更短、更直接的電源連接,從而降低功率損耗。這種方式對于高性能應用尤其重要,因為在這些應用中,電源的穩(wěn)定性和效率直接影響到整體系統(tǒng)的表現(xiàn)。
*三維設計與先進技術的結合*
英飛凌采用三維設計方式,結合業(yè)界領先的功率器件和封裝技術,憑借深厚的系統(tǒng)底蘊,提供高性能的節(jié)能計算解決方案,這進一步支持了推動數(shù)字化和低碳化的企業(yè)使命。
通過采用英飛凌強大的OptiMOS? 6溝槽式技術功率組件和嵌入式芯片封裝,OptiMOS? TDM2454xx模塊提供優(yōu)異的電氣和散熱性能。同時,創(chuàng)新的超薄電感設計技術不斷提升VPD系統(tǒng)性能和質量的極限。此外,OptiMOS? TDM2454xx的結構設計有利于模塊化拼接,改善電流傳導,進一步提升電氣、散熱和機械性能。
(圖片來源于英飛凌官網(wǎng))
該模塊在四相電源中最高支持280A電流,并在僅10x9 mm2的小型封裝內整合了嵌入式電容層,結合英飛凌的XDP?控制器,可以實現(xiàn)穩(wěn)定耐用的高電流密度功率解決方案。通過這些創(chuàng)新,英飛凌為未來的計算需求提供了強有力的支持。
21ic:AI數(shù)據(jù)中心增長潛力很大,但而電源部分在其中的價值占比目前不足10%。英飛凌如何看待這一市場的未來發(fā)展趨勢?
隨著生成式AI應用的持續(xù)升溫,全球對高性能計算(HPC)的需求快速增長。盡管業(yè)界的焦點多集中于處理器技術的進展,但數(shù)據(jù)中心與AI服務器的電源系統(tǒng)正面臨前所未有的挑戰(zhàn)。電力需求的激增促使電源設計向高電壓、高功率密度發(fā)展,同時必須提升轉換效率、縮小外形尺寸,并符合日益嚴格的節(jié)能與可持續(xù)標準,同時保持合理的運營成本。
目前,電源在整體系統(tǒng)中所占的比例可能看似不高,但隨著AI服務器運算能力的提高,單一GPU的功耗已經(jīng)達到700W,甚至上升至1.5kW、2kW。整體AI服務器機柜的功耗也從傳統(tǒng)服務器的10kW攀升至120kW以上。這一趨勢表明,面對AI運算耗電比例的不斷上升,提升電源效率與功率密度已成為當務之急。也可以說“沒有電源就沒有AI”,這充分體現(xiàn)了電源在AI系統(tǒng)中的重要性。
*英飛凌的全面電源管理解決方案*
英飛凌憑借其在功率半導體設計、制造與電源系統(tǒng)應用的深厚技術實力,提供從電網(wǎng)到主板處理器的完整電源管理解決方案。這些解決方案涵蓋硅(Si)、碳化硅(SiC)和氮化鎵(GaN)三大主流材料,為AI運算基礎設施提供高效、可靠、可擴展且具有成本效益的電力傳輸。
通過這些創(chuàng)新,英飛凌致力于為快速發(fā)展的AI技術提供強有力的支持,確保電源系統(tǒng)能夠滿足未來計算需求的挑戰(zhàn)。
21ic:在800V HVDC這樣的前沿電源架構的探索階段中,作為芯片廠商參與到其中,英飛凌的核心價值、貢獻及影響力體現(xiàn)在哪些方面?
AI算力的增長與技術演進正在以前所未有的速度進行,這對能源需求與AI服務器生態(tài)系統(tǒng)帶來了重大挑戰(zhàn)。半導體處于AI的核心,協(xié)助驅動、收集、處理和管理AI系統(tǒng)運作所需的大量數(shù)據(jù)。
(圖片來源于英飛凌官網(wǎng))
英飛凌專注于考慮整個生態(tài)系統(tǒng)的能源效率,特別是從電網(wǎng)到主板核心的電源管理,以支撐AI的功能運作。通過與生態(tài)系統(tǒng)合作伙伴的密切合作,提升AI服務器的可靠性,降低碳排放和總體擁有成本(TCO),從而實現(xiàn)AI可持續(xù)發(fā)展的未來。
隨著服務器架構過渡至高壓直流(HVDC)供電設計,整個電源流程管理需要重新設計。憑借在電源系統(tǒng)領域的豐富經(jīng)驗,英飛凌提供了一系列AI服務器電源管理解決方案,包括硅(Si)、碳化硅(SiC)和氮化鎵(GaN)技術。這些解決方案確保每個階段的最佳電源轉換,并降低供電網(wǎng)絡(PDN)的損耗。
通過這些努力,英飛凌致力于推動創(chuàng)新,確保AI服務器能夠高效、可靠地支持未來的計算需求。
21ic:您認為800V HVDC會在多長時間內成為AI數(shù)據(jù)中心主流?48V架構會否繼續(xù)主導?英飛凌如何為未來電源架構做準備?
當前,AI數(shù)據(jù)中心的功耗與電源架構正在快速演變,這主要是由于大型AI訓練集群(特別是GPU/加速器服務器)對于功率密度、效率與配電距離的要求不斷提升。
·從短期來看,48V架構依然成熟,因其技術成熟度高、供應鏈完整且已有大量實際部署案例。
·從中期來看,800V高壓直流(HVDC)技術可能在部分新建或超大規(guī)模的AI數(shù)據(jù)中心中進行試點應用,特別是那些需要長距離配電和極高功率需求的場景。
·從長期來看,若標準化、安全規(guī)范與配套生態(tài)系統(tǒng)進一步成熟,800V架構有望在高端AI數(shù)據(jù)中心中占據(jù)顯著比例。然而,全面取代48V架構可能仍需更長的時間。
隨著AI算力的持續(xù)增長,英飛凌將繼續(xù)發(fā)揮在AI服務器生態(tài)圈中的重要角色,持續(xù)與全球及各生態(tài)系統(tǒng)的合作伙伴攜手共進。共同定義并開發(fā)更高能效的AI服務器電源解決方案,以助力客戶迎接AI時代的能源挑戰(zhàn),實現(xiàn)AI運算的可持續(xù)未來。通過這些努力,英飛凌致力于推動電源系統(tǒng)的創(chuàng)新,確保其能夠滿足未來計算需求的變化與挑戰(zhàn)。