一臺服務器,要經歷多少打磨與雕琢,方能抵達客戶?
因果相承,已是全球第二、中國市場第一的浪潮服務器,耀眼成績的背后有著怎樣的努力和堅持?
高品質的代名詞,何以得來?
滿足客戶需求,一句說易行難的行業口頭禪,要如何做到的?
浪潮信息邊緣計算產品總設計師孫波,講述關于服務器誕生的那些事……
小風扇,大學問
隨著業務負載的激增,服務器計算、存儲的性能也在不斷提升,CPU、GPU等部件功耗快速攀升,比如CPU最大功耗從原來的150瓦提升到200瓦、250瓦甚至300瓦,服務器內部熱量疏導面臨巨大挑戰,散熱風扇的轉速從每分鐘1萬轉提升到2萬轉,甚至達到3萬轉。但對于高精密度的服務器來說,看似簡單的風扇轉速提升可能會產生一系列復雜影響,就像氣象學家提出的“蝴蝶效應”——亞馬遜流域的一只蝴蝶扇動翅膀,可能會掀起密西西比河流域的一場風暴。
因此,散熱仿真成為服務器設計中很重要的一環,他決定著在不同業務負載中,如何為整個系統提供最合適的溫度環境,以保證計算、存儲發揮最佳實力。但就在日常的散熱仿真中,工程師發現風扇隨著轉速提升,吹出來的風流實際上會有湍流效應,也就是說風并非平穩的沿著直線流動,而是旋轉著往前走,數個風扇之間的風流就會“打架”、產生“亂流”,造成內部氣流、部件的振動。如何解決該問題呢?
這需要機箱結構方面,對風扇進風口的風流、風道,進行約束、整流。浪潮信息在其新一代產品M6系列服務器之上,新增“波導網”設計——當風流通過這個六邊形蜂窩狀波導網時,旋轉的湍流被切割成平流,為整個空間提供平行穩定且強勁的氣流。
這一巧思收益顯著,不僅大幅降低因為空氣擾動帶來的振動,還提升了17%~22%散熱效率。
另外還有一些設計,比如將硬盤懸浮使其與機箱軟連接,緩沖、吸收振動,以及加裝吸音棉來減少振動及噪音。
服務器,是一類成熟已久的產品形態,其架構、組件、搭配、布局等諸多環節經過幾十年的發展,業已定型??晒┭邪l人員施展的空間,更多的是在細節——基于“大處著眼、小處著手”,浪潮信息工程師從細節入手,發揮創新及工匠精神,力求做到精益求精。
大機柜,大動作
風扇緊隨硬盤,是業內通行的做法。硬盤自身的振動和風扇轉速提高帶來的振動,對硬盤的損傷極大,導致故障發生,兩者疊加帶來的影響更是明顯。
如果將風扇移至到服務器機柜的后端呢?浪潮整機柜服務器就采用了這樣的結構,將風扇移至機柜的最后部,拉遠與硬盤的距離,而和機柜柜體形成了一個整體。相比風扇,機柜的體量巨大,兩者的振動疊加實際上起到了“削峰填谷”的功效。此振動再傳到硬盤之時,就已經有了大幅降低。
“如此設計的效果明顯,相比傳統的服務器結構,硬盤故障率下降了將近一個數量級。”
事實上,這樣的設計并非是簡單的移位而已,既定的服務器電源、硬盤、存儲等內部結構需要重新規劃,其間的組件需要重新布局,是牽一發而動全身的大動作。
不僅僅是產品設計的“大動作”,全新結構的整機柜服務器還要考慮如何保障運輸過程中不受道路顛簸的振動影響。因此測試工程師在貨車輪軸、車體、服務器機柜柜體及節點、硬盤、內存,以及機柜的木托,幾乎所有會受到振動的位置都安裝傳感器,驅車從濟南出發到杭州千島湖,又北上一直到內蒙古,全程奔襲約三千公里,為的就是抓取沿途所有的振動信息,形成基于路譜的振動測試數據樣本,以此路譜測試而形成服務器機柜測試的標準和規范。
同時,此標準和規范還要更嚴格于路譜測試中取得的數值,從而保證機柜成品在運輸及交付過程中萬無一失。
盡管如上文所言,服務器這種成熟型產品給予研發的施展空間有限,但浪潮信息似乎未曾受此制約,敢讓舊貌換新顏,其創造力顛覆了業界規則,重新定義了IDC,將整機柜作為大規模數據中心部署的“積木”。如今,不斷升級的整機柜形態的服務器成為近50%的大規模數據中心的主流形態。
從數據中心到邊緣,服務器開始防水、防塵、耐高溫
相比通用服務器,邊緣計算對服務器的要求更高。其部署場景從“條件優越”的數據中心遷移至沙漠戈壁、江河湖海、東北油田等“極端惡劣”的場景要承受風沙、雨水、酷熱、嚴寒等多重考驗。
比如在戶外場景中,服務器難免會遇到雨水淋浸,如果密封性不達標,雨水通過縫隙滲到電子元器件或者PCB板上,極易引起元器件短路甚至設備報廢。針對這樣的使用環境,工程師要進行防水防塵實驗,并優化服務器內部散熱結構,以保障無論是高溫、暴雨還是風沙、極寒的惡劣戶外環境中依然可以穩定運行。
比如路邊的信號控制箱,由于箱體內沒有散熱裝置,一些簡單的通風孔因避免雨水進入而將出口設置為朝下,熱氣流很難排出,所以當外界溫度達到40℃時,箱體內部會遠遠高于這一數字——相應的,浪潮邊緣服務器要求支持到65℃甚至70℃的高溫。
無空想不臆斷,一切結論來源于實踐,取自于真實需求。
品質的守門員
以上案例,只是在“浪潮澎湃實驗室”進行過的幾個小片段,窺斑見豹,這樣的場景在此地時時上演、發生著。
在澎湃實驗室里,擁有包括氣候環境、機械環境、結構散熱、電磁兼容、系統驗證、精密測量、失效分析和數據中心等實驗室,涵蓋服務器創新技術預研、產品部件驗證、新品定型、出廠質量檢測等一系列測試環節。
同時,其間的每一項測試,都有著細致的流程及管控措施。
浪潮每年研發兩三百款產品,據統計,每一款產品在出廠前都會經過超2000次的測試,涵蓋30余種極限測試——毫無疑問,“浪潮澎湃實驗室”嚴苛的研發標準和測試機制,保障著服務器產品的高品質。
高標準嚴要求
值得特別指出的是,針對一些具有國標的產品線,需要在國標基礎上再額外提高標準。例如通用服務器,其國標要求是在35℃高溫下持續運行兩小時,而在澎湃實驗室里會將此標準做進一步的細化和加嚴測試——在高溫高濕和高溫低濕環境下將溫度上提至40℃,持續運行16小時甚至24小時。
而針對一些暫時沒有國標或者新產品,需要積極摸索、提煉其測試標準,這個從零到一的過程,實際上更多源于經驗和測試手段總結而來。前文提到的,邊緣服務器支持65℃甚至70℃高溫,即是一例證。
無論有無國標,工程師都會按照業界實際使用的環境、應用場景來不斷打磨其產品,并提高標準,即“高標準嚴要求”。
在遵循并超越標準的同時,浪潮信息還積極參與制定標準。
截至目前,浪潮信息牽頭和參與標準制修訂99項,其中國際標準8項,國行標79項;在服務器領域,牽頭和參與標準制修訂11項,其中國際標準1項,國行標8項;牽頭制修訂的5項服務器國家標準已發布,其中GB/T 39680-2020《信息安全技術—服務器安全技術要求和測評準則》,適用于服務器的研制、生產、維護和測評。
圍繞著服務器做足文章,浪潮對此不遺余力。
聯合定制開發
不僅如此,浪潮首創的JDM(Joint Design Manufacture,聯合設計開發制造)模式,也正在凸顯出驚人的爆發力。
而今,客戶需求的差異化愈加明顯,需要服務器產品在品類、功能和配置等更加豐富、多樣。特別是邊緣服務器,面對的應用場景千差萬別,連接的設備五花八門,都極具“個性”。
如何做到模塊化設計,將個性需求“產品化”?在保證高品質的前提下,如何進行快速迭代、縮短交付周期?如何將計算、AI、網絡處理、接口等功能單元獨立出來,并可以靈活地按需組合?……
JDM就是浪潮正在推行并取得顯著成效的“方法論”——從其具備的五項要素及特點,就可看出這一模式具有的優越性,即共同挖掘需求、協同研發、產品管控、供應鏈對接、全球交付與服務。
歸結到底,JDM模式即是“聯合定制開發”的理念:從產品立項研發之時,客戶就深度參與,雙方緊抓實際需求予以產品定制,并將定制這一核心理念貫穿于產品全生命周期。
近幾年,浪潮先后與阿里、百度、騰訊、京東、網易等客戶進行了JDM合作,在AI、邊緣、云計算領域聯合創新。
系出“澎湃”
研發及測試工作,從來都不是腦洞大開、靈感乍現、一蹴而就,而是無數的測試、紛繁的數據、反復地打磨、辛勤的日與夜……也唯有“精益求精”一詞來描述。
自1993年推出首款服務器,近30年心無旁騖,積跬步致千里,浪潮信息的成功實屬必然,奪得全球第二即是市場對其授予的軍功章——之上,亦有“澎湃”之名……