每日經濟新聞 2023-02-24 14:01:22
◎《流浪地球2》中新型計算機的“原型”來源于中科曙光還未正式發(fā)布的“缸式”新型浸沒液冷計算機。中科曙光及旗下公司曙光數(shù)創(chuàng)在液冷技術領域已探索多年,這一技術目前被廣泛用于構建綠色數(shù)據(jù)(算力)中心——為了解決數(shù)據(jù)中心節(jié)能減碳問題,中科曙光接連推出新技術為服務器、存儲器“降溫”,打造存算一棧式液冷方案。
每經記者 范芊芊 每經編輯 文多
在電影《流浪地球2》中,出現(xiàn)了一臺“2058年的計算機”,它可滿足數(shù)萬座發(fā)動機協(xié)同運作,并支撐“數(shù)字生命”計劃所需算力。這臺新型計算機的“原型”來源于中科曙光還未正式發(fā)布的“缸式”新型浸沒液冷計算機。中科曙光及旗下公司曙光數(shù)創(chuàng)在液冷技術領域已探索多年,這一技術目前被廣泛用于構建綠色數(shù)據(jù)(算力)中心。
計算、存儲、網絡被稱為數(shù)據(jù)中心的三大IT基礎設施,也是數(shù)據(jù)中心耗電量的重要來源,為了解決數(shù)據(jù)中心節(jié)能減碳問題,中科曙光旗下公司曙光數(shù)創(chuàng)推出浸沒式相變液冷方案為服務器“降溫”。去年,中科曙光則推出了曙光ParaStor液冷存儲系統(tǒng)為存儲器“降溫”,打造存算一棧式液冷方案。
目前,由中科曙光參與建設的眾多液冷數(shù)據(jù)中心,一年節(jié)省電能達2億度,節(jié)省的這些電能可滿足12.5萬個中國家庭全年用電,相當于減少66157噸二氧化碳的排放。
國家“東數(shù)西算”工程啟動已有一年,全國各地的數(shù)據(jù)中心項目正在緊鑼密鼓地建設中,以滿足數(shù)字經濟時代日益增長的算力需求。作為新基建的重要組成部分,算力已經成為拉動數(shù)字經濟增長的一輛重要馬車,是新的生產力。
但與此同時,數(shù)據(jù)中心也被業(yè)內稱為耗電大戶。中國電子技術標準化研究院數(shù)據(jù)顯示,2021年全國數(shù)據(jù)中心能源消耗達到2166億千瓦時,這相當于超1億個中國家庭的全年用電量。在“雙碳”戰(zhàn)略目標的背景下,如何在保障數(shù)據(jù)中心穩(wěn)定高效運營的前提下節(jié)能減排,成為業(yè)界和學界研究的重點。
數(shù)據(jù)中心為何耗電量大?在曙光云計算集團首席戰(zhàn)略架構師王建波看來,數(shù)據(jù)中心的耗電體現(xiàn)在兩個方面,一方面是數(shù)據(jù)中心所承載的提供算力服務的IT設備,另一方面則是保障IT設備穩(wěn)定運行的制冷設備。
服務器、存儲、網絡被稱為數(shù)據(jù)中心基礎設施的三大件。在一座超大型數(shù)據(jù)中心里,數(shù)層高樓,數(shù)千平方米的土地上,僅密密麻麻排列著的服務器就數(shù)以萬計,這些設備24小時不停歇運行,以支撐上游應用場景,其中一張?zhí)峁┧懔Φ腉PU卡的功率都有幾百瓦,可想而知一座數(shù)據(jù)中心的能耗量是一個天文數(shù)字。
隨著應用場景對算力的種類數(shù)量和質量精度等要求越來越高,服務器的耗電量將越來越大。王建波告訴記者,(服務器)處理性能越強,集成度越高,耗電量同樣也就越大,這是一種相輔相成的關系。“例如一塊單晶硅片上集成的數(shù)字電路越密集,其處理能力越強,但耗電量也越大。”
保障IT設備穩(wěn)定運行的其他設備則包括除濕、散熱等設備。在業(yè)內,為了精準計算數(shù)據(jù)中心的能源利用率,將數(shù)據(jù)中心消耗的所有能源與IT負載消耗的能源的比值稱為PUE(Power Usage Effectiveness),PUE值越低,意味著能源利用率越高。
要實現(xiàn)數(shù)據(jù)中心的節(jié)能減排,則要從降低PUE值來入手。工信部印發(fā)的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》中,明確指出到2023年底,新建大型及以上數(shù)據(jù)中心PUE降低到1.3以下,嚴寒和寒冷地區(qū)力爭降低到1.25以下。
那么如何降低數(shù)據(jù)中心PUE值?耗電量最大的服務器是節(jié)能降碳的重點,冷卻則是關鍵一環(huán),一方面高溫可能會使服務器停止運行,另一方面溫度越高則意味著降溫需要消耗的電量越大。“數(shù)據(jù)中心制冷主要有幾種方式,如風冷、液冷等,其中PUE達到1.1以下的基本依靠液冷。”王建波告訴記者。
所謂液冷,是指用流動液體將計算機內部元器件產生的熱量傳遞到計算機外,以保證計算機工作在安全溫度范圍內的一種冷卻方法,目前液冷技術分為冷板式、噴灑式和浸沒式。
早在2011年,中科曙光便開始節(jié)能液冷技術的探索與研究,其浸沒式相變液體方案被應用于全國多個數(shù)據(jù)中心。
在成都中科曙光參建的一座“綠色數(shù)據(jù)中心”,機房的服務器就采用了曙光數(shù)創(chuàng)的浸沒式相變液冷方案。記者了解到,包含CPU(中央處理器)、GPU(圖形處理器)等元器件在內的服務器被直接浸沒在一種電子氟化液中,不斷冒出沸騰的小氣泡,這些小氣泡帶著熱量進入裝有冷水的冷卻裝置,待溫度下降后再循環(huán)回到服務器,而吸收了熱量的熱水則隨著管道進入外部的冷卻塔。
所謂浸沒式相變液冷方案,關鍵詞是“浸沒”和“相變”。王建波告訴記者,區(qū)別于冷板式液冷,浸沒式相變液冷方案不是將散熱最多的關鍵元器件放入液體中,而是將服務器整體浸沒在液體中。相變則是指物質狀態(tài)發(fā)生改變,高溫使上述電子氟化液在50攝氏度左右便沸騰轉化為氣體,繼而與冷水進行熱交換。
上述散熱方式能帶來哪些益處呢?一方面由于上述液態(tài)高分子材料沸點較低,該解決方案可使CPU等主要芯片運行溫度下降10攝氏度左右,從而額外帶來10%~30%的應用性能提升,同時溫度變化幅度減小,也提升了數(shù)據(jù)中心運行的穩(wěn)定可靠性;另一方面該解決方案去掉了空調系統(tǒng)以及對應的風冷基礎設施,建設成本降低,使數(shù)據(jù)中心實現(xiàn)全年自然冷卻,風扇風機能耗降低接近100%,相較于風冷總能耗降低約30%。
另外,區(qū)別于其他液冷技術,由于將服務器整體浸沒,以及采用氣體的形式帶走熱量,浸沒式相變液冷方案采用高密度部署,可為機房節(jié)省85%左右的空間。這也就意味著同樣面積的機房內能夠放置更多的服務器,從而提高運算效率,同樣數(shù)量的服務器則可以放置在更小的空間內,從而降低能耗。
王建波舉例說,例如原來(一定數(shù)量的服務器)需要放在五層樓里,每層樓需要放置照明燈、空調等,采用上述方案現(xiàn)在可以放在兩層樓里,就可以節(jié)約三層樓的電力開銷。
除了服務器,存儲系統(tǒng)同樣是數(shù)據(jù)中心耗電量較大的設備。中國數(shù)據(jù)中心節(jié)能委員會的一項研究表明,數(shù)據(jù)中心IT設備系統(tǒng)所產生的功耗中,服務器系統(tǒng)約占50%,存儲系統(tǒng)約占35%。因此,存算一棧式液冷方案成為實現(xiàn)數(shù)據(jù)中心“深度綠色化”的關鍵一環(huán)。
為此,中科曙光在去年推出了曙光ParaStor液冷存儲系統(tǒng),這也是業(yè)內首個液冷存儲系統(tǒng),其將冷板液冷方案與存儲技術結合。相比風冷模式,液冷存儲系統(tǒng)性能提升超過20%,以EB級單位存儲設施的耗電量為例,相比風冷模式,采用液冷存儲一年可節(jié)電450萬千瓦時,減少1493噸二氧化碳排放。
相較于服務器,內存、機械硬盤等存儲關鍵部件采用液冷方案的難點在哪兒?王建波告訴記者,通用的電子元器件要放到一種液體里,而且要支持熱插拔(帶電插拔),其中有很多技術性的突破。“比如我把CPU內存儲器取下來,取下來之后口要盡快封閉,否則就連電了,在插拔一瞬間還不能讓液體進去,這里面都有很多突破性的設計。”
例如,中科曙光所設計的液冷存儲方案中,在硬件設計時,保證硬盤盤盒與液冷箱體的接觸面積滿足機械硬盤的散熱需求,并且硬盤的插拔操作不會帶來散熱接觸面的變化,增加了液冷循環(huán)系統(tǒng)后,仍能保持硬盤的獨立熱插拔。
從計算與存儲兩個維度助力數(shù)據(jù)中心行業(yè)綠色低碳、節(jié)能減排的同時,中科曙光在自身產品的生產方面同樣注重綠色節(jié)能。
據(jù)悉,曙光智能制造基地從產品設計開發(fā)、原材料選用、生產工藝驗證、包裝優(yōu)化到回收利用全面貫徹綠色制造理念,不良品率、運營成本較早先生產線分別下降了20%、33%,單位產值能耗降低30%。
王建波告訴記者,基地全部采用無燈工廠,機器人生產作業(yè),生產可靠性提升。據(jù)了解,基地采用先進的國產機器人和數(shù)字孿生技術實現(xiàn)自動化生產和智能監(jiān)控,工廠自動化率達95%以上,平均每90秒便可組裝一臺高端服務器產品。
(實習生羅藝對本文亦有貢獻)
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP