以客戶為中心,提供定制化或一站式的全棧解決方案,賦能千行百業(yè)
近年來,由于地球環(huán)境的不斷惡化,極端天氣頻發(fā),海洋環(huán)境遭到嚴(yán)重污染,自然氣象災(zāi)害的增多,對(duì)氣象預(yù)報(bào)、海洋領(lǐng)域業(yè)務(wù)提出更高、更旺盛的需求。天氣氣候預(yù)報(bào)的數(shù)值預(yù)測(cè)模式日益成熟,關(guān)于海洋環(huán)境領(lǐng)域的研究也越來越受到重視,高性能計(jì)算機(jī)處理能力也越來越高,將高性能計(jì)算機(jī)應(yīng)用于氣候、海洋、環(huán)境領(lǐng)域模式可以實(shí)現(xiàn)對(duì)其模式的最佳提升,目前,高性能計(jì)算機(jī)早已成為開展氣候、海洋環(huán)境等數(shù)值模擬業(yè)務(wù)和科學(xué)研究所必須的基礎(chǔ)工具。寶德為氣象、海洋領(lǐng)域提供硬件服務(wù)全方位的解決方案。
針對(duì)氣象、海洋領(lǐng)域模式的主要特點(diǎn) :浮點(diǎn)計(jì)算量大、通信密集、要求系統(tǒng)具有高穩(wěn)定性和高I O吞吐能力。寶德高性能計(jì)算機(jī)系統(tǒng)區(qū)別于傳統(tǒng)的集群高性能計(jì)算機(jī),在如上幾個(gè)方面進(jìn)行了強(qiáng)化設(shè)計(jì)。 寶德PR6010P刀片服務(wù)器和PR2750P機(jī)架服務(wù)器采用Intel C624高性能芯片組處理器架構(gòu),處理能力 高達(dá)1.2Tf lops,具有強(qiáng)大的計(jì)算能力。 網(wǎng)絡(luò)系統(tǒng)方面采用單向56Gb s高速FDR Infiniband作為通信網(wǎng)絡(luò)以解決中大規(guī)模系統(tǒng)中的網(wǎng)絡(luò)壓力問題, Infiniband網(wǎng)絡(luò)是當(dāng)今業(yè)界最成熟的通用高速網(wǎng)絡(luò),在目前TOP500的大型集群系統(tǒng)中占據(jù)著絕對(duì)主流。為保證應(yīng)用的數(shù)據(jù)訪問的性能和安全,在存儲(chǔ)硬件方面,寶德提供企業(yè)級(jí)FC-SAN存儲(chǔ)系統(tǒng),專業(yè)的企業(yè)級(jí)磁 盤、功能強(qiáng)大的存儲(chǔ)管理軟件以及模塊化結(jié)構(gòu)為用戶快速、簡(jiǎn)便和動(dòng)態(tài)響應(yīng)不斷變化的容量和性能要求提供 了前所未有的靈活性。
計(jì)算量大:中尺度氣象預(yù)報(bào)模式(MM5、WRF、GRAPES和AREMS),物理海洋模式如ROMs、Fvcom等都有非常大的計(jì)算量,預(yù)報(bào)精度提高一倍,其所需計(jì)算量將成幾何級(jí)上漲。目前上文提到的絕大部分預(yù)報(bào)模式都已經(jīng)完成了并行化 ,如中尺 度 預(yù)報(bào) 模 式 的MM5、WRF既支持MPI消 息傳 遞 并行 ,又支持OpenMP共享存儲(chǔ)并行 ,也支持MPI+OpenMP的混合運(yùn)行模式。海洋模式中的FVCOM、ROMS、POM、HYCOM等等,環(huán)境模式中的CMAQ、CCSM3、 CAM等等均支持高性能計(jì)算,并具有良好的可擴(kuò)展性。
通訊密集:由于這些模式都是并行軟件,同時(shí)一般都采用有限差分格點(diǎn)模式并行計(jì)算,所以運(yùn)行這些預(yù)報(bào)模式時(shí),各個(gè) CPU之間的通訊量很大,模式對(duì)通訊的性能要求非常高。如氣象中尺度預(yù)報(bào)模式MM5、WRF的通訊既包括母域 和嵌套域之間的域間通訊,又有各個(gè)域內(nèi)部不同數(shù)據(jù)劃分之間的通訊。所以這就要求高性能計(jì)算機(jī)有高性能 的通訊網(wǎng)絡(luò)。
對(duì)系統(tǒng)IO性能要求高:海洋模式如物理海洋和海洋地質(zhì)領(lǐng)域的程序大都對(duì)整個(gè)系統(tǒng)的IO性能有較高要求,一般要求有分布式IO或者 并行文件系統(tǒng),否則可能很難有太好的加速比。
規(guī)范的模式系統(tǒng)化集成:氣象、海洋、環(huán)境領(lǐng)域模式從軟件的處理流程上看,一般分為前處理、主模式和后處理三個(gè)過程。前處理包 括資料的傳輸下載、數(shù)據(jù)同化等等,后處理主要是指圖形化處理生成產(chǎn)品等,前/后處理一般對(duì)計(jì)算機(jī)要求不是太高。主模式是整個(gè)系統(tǒng)的主要部分,也是主要計(jì)算量所在,這個(gè)部分是對(duì)計(jì)算機(jī)性能要求較高,整個(gè)模式系統(tǒng)從前處理到主模式然后到后處理這樣的流程運(yùn)行下來也需要系統(tǒng)具有較高的穩(wěn)健性,所以優(yōu)秀的模 式軟件應(yīng)用專家支持及硬件級(jí)的系統(tǒng)技術(shù)支持均對(duì)模式的良好使用也是關(guān)鍵。 對(duì)于構(gòu)建一個(gè)針對(duì)氣象、海洋的高性能計(jì)算系統(tǒng),在選擇基礎(chǔ)硬件環(huán)境時(shí),以下四點(diǎn)是非常重要的。
1、高性能,特別是浮點(diǎn)處理性能
2、高性能網(wǎng)絡(luò)環(huán)境
3、高性能的分布IO或者并行文件系統(tǒng)
4、系統(tǒng)的高穩(wěn)健性
該方案采用寶德可擴(kuò)展系列高性能計(jì)算機(jī)系統(tǒng),寶德PR2750P是寶德公司在2018年推出 的跨時(shí)代的高性能計(jì)算機(jī)產(chǎn)品,它不僅在眾多方面超越了傳統(tǒng)的集群式高性能計(jì)算機(jī),具有高穩(wěn)定 、高可用、高擴(kuò)展、高密度、高性能的特點(diǎn),適用于各類氣象、海洋部門。
整個(gè)系統(tǒng)浮點(diǎn)計(jì)算理論峰值可以達(dá)到7.6萬億次以上 ;計(jì)算模塊間采用56Gbps 高速Infiniband互聯(lián),端到端延遲小于1.2us,優(yōu)于市場(chǎng)上的所有的商品化高速互聯(lián)網(wǎng)絡(luò)。
所有關(guān)鍵部件上,如電源、硬盤以及網(wǎng)絡(luò)等都做到了冗余設(shè)計(jì),是保證程序模式高穩(wěn)定性運(yùn)行的保證