時(shí)間:2023-09-05來源:本站
8月的最后一天,大模型賽場最新消息:百度文心一言、百川大模型、質(zhì)譜清言等官宣率先通過《生成式人工智能服務(wù)管理暫行辦法》備案,即日起可面向全社會(huì)開放服務(wù)。據(jù)悉,包含這3支大模型在內(nèi),國內(nèi)共有11家大模型陸續(xù)通過《生成式人工智能服務(wù)管理暫行辦法》備案,并于8月31日起將陸續(xù)向全社會(huì)公眾開放服務(wù)。這也預(yù)示著大模型之戰(zhàn)從拼技術(shù)、拼參數(shù)轉(zhuǎn)向拼應(yīng)用、拼落地,但是應(yīng)用為王的大模型,依然離不開強(qiáng)悍堅(jiān)實(shí)的AI算力底座。
作為中國領(lǐng)先的計(jì)算產(chǎn)品服務(wù)提供商和中國AI服務(wù)器市場TOP3,寶德計(jì)算全新AI算力方案致力于為大模型的萬千應(yīng)用和服務(wù)夯實(shí)底座。
寶德AI訓(xùn)練服務(wù)器PR4910E+L40S
大模型加速訓(xùn)練利器
大模型訓(xùn)練需要海量數(shù)據(jù)的運(yùn)算和處理,計(jì)算王者寶德AI訓(xùn)練服務(wù)器PR4910E是不二之選。PR4910E支持10張全新發(fā)布的NVIDIA L40S GPU卡,同時(shí)采用2顆身懷七大算力神器的第四代英特爾®至強(qiáng)®可擴(kuò)展處理器,最大可達(dá)60核心,為大模型訓(xùn)練提供強(qiáng)有力的算力支撐。它具有13個(gè)PCIe x16 Gen5插槽,支持32個(gè) DIMM / DDR5內(nèi)存插槽,支持最新的400Gb ETH和NDR IB高速智能網(wǎng)卡,以及 GPU Direct RDMA,最多支持24個(gè) NVMe SSD,而且采用CPU 直通設(shè)計(jì),大幅降低 I/O 延遲,為大模型數(shù)據(jù)存儲(chǔ)和傳輸提供高效可靠的保證。此外,它采用整機(jī)模塊化設(shè)計(jì),支持靈活切換 CPU 和 GPU 的異構(gòu)拓?fù)浣Y(jié)構(gòu),非常便于用戶的系統(tǒng)維護(hù)和管理。該產(chǎn)品已經(jīng)廣泛應(yīng)用于大模型、人工智能、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò),賦能醫(yī)學(xué)、材料、金融、科技等千行百業(yè)智能化轉(zhuǎn)型和應(yīng)用。
寶德AI服務(wù)器PR8908WG+ Gaudi®2
大模型性價(jià)比之王
以大模型算力性價(jià)比著稱的寶德AI服務(wù)器PR8908WG,采用第三代英特爾®至強(qiáng)®可擴(kuò)展處理器,8U空間支持8顆OAM高速互聯(lián)的Gaudi®2 AI加速器,每顆Gaudi®2芯片配置96GB HBM高速內(nèi)存,GPU與 GPU 之間互聯(lián)帶寬達(dá)到400GB/s,提供2.1Tbps的P2P互聯(lián)帶寬,支持全互聯(lián)拓?fù)洌鏉M足大模型訓(xùn)練的海量通信需求;擁有32個(gè)DDR4 DIMM插槽,支持24塊2.5英寸SAS/SATA熱插拔硬盤位,采用 CPU 直通設(shè)計(jì),降低 I/O 延遲;它支持200Gb ETH和HDR高速智能網(wǎng)卡,支持GPU Direct RDMA,完美滿足集群和超大規(guī)模擴(kuò)展應(yīng)用。
PR8908WG整機(jī)采用模塊化設(shè)計(jì),獨(dú)立的GPU和CPU 熱量分區(qū)設(shè)計(jì)確保系統(tǒng)在最苛刻的工作負(fù)載下性能和穩(wěn)定性不受影響,也非常方便用戶對(duì)AI算力設(shè)備的維護(hù)管理。它可以滿足AI不同場景下海量數(shù)據(jù)的計(jì)算和推理需求,特別適用于大模型訓(xùn)練和推理、深度學(xué)習(xí)、自動(dòng)駕駛、智能城市、醫(yī)療健康、大數(shù)據(jù)、高性能計(jì)算 (HPC) 和虛擬現(xiàn)實(shí)等應(yīng)用場景,幫助加速更多AI技術(shù)的落地和應(yīng)用。
寶德自研AI推理服務(wù)器PR2715E
大模型應(yīng)用的得力助手
大模型上線開放服務(wù)之時(shí),模型推理應(yīng)用的工作負(fù)載將面臨更多的挑戰(zhàn),寶德自研AI推理服務(wù)器PR2715E可以成為其落地應(yīng)用的得力幫手。它具有極致性能、卓越能效和能打的顏值,專注于高性能計(jì)算推理、云計(jì)算和數(shù)據(jù)中心等算力需求。
PR2715E采用2顆第四代英特爾®至強(qiáng)®可擴(kuò)展處理器,提供強(qiáng)大的通用計(jì)算能力,支持DDR5、PCIe 5.0和HBM,性能提升高達(dá)50%;支持異構(gòu)設(shè)計(jì),可以支持8張單寬或3張雙寬GPU卡,擁有強(qiáng)勁的AI推理算力和安全性能。它有32個(gè)內(nèi)存插槽,最大可支持8TB;它最大支持12個(gè)2.5 ”( 3.5”)和4個(gè)后置2.5 "SATA/SAS/NVMe熱插拔硬盤,或24個(gè)2.5 ”SATA/SAS/NVMe 和2個(gè)后置2.5 ”SATA/SAS熱插拔硬盤,支持內(nèi)置1個(gè)M.2(NVMe/SATA),保障了整機(jī)性能的強(qiáng)勁可靠;此外,PR2715E具有智能散熱系統(tǒng)、支持液冷散熱,能夠進(jìn)一步幫助用戶降低TCO。
寶德自研商用并行存儲(chǔ)系統(tǒng)PLStor GS9200
大模型存力之基
隨著大模型規(guī)模的提升和落地應(yīng)用,海量數(shù)據(jù)的指數(shù)級(jí)增長勢必帶來存儲(chǔ)和處理這些數(shù)據(jù)的更多難題。因此,強(qiáng)大的存力成為大模型有效服務(wù)的基礎(chǔ)保障之一。寶德PLStor GS9200是一款面向大模型多應(yīng)用場景,以性能為中心,具備高可靠、簡單易用和豐富企業(yè)級(jí)功能等優(yōu)勢的領(lǐng)先并行存儲(chǔ)系統(tǒng)。其存儲(chǔ)集群支持無上限的大規(guī)模擴(kuò)展,可以輕松擴(kuò)展到EB級(jí)別,并能夠承載上萬臺(tái)AI/異構(gòu)算力服務(wù)器,滿足大容量存儲(chǔ)需求。
寶德PLStor GS9200提供了業(yè)內(nèi)領(lǐng)先的基于OS內(nèi)核程序優(yōu)化設(shè)計(jì)的原生客戶端,以一客戶端對(duì)多臺(tái)存儲(chǔ)節(jié)點(diǎn)的方式并行讀寫數(shù)據(jù),支持RDMA技術(shù),整個(gè)系統(tǒng)能提供上TB/s級(jí)的吞吐帶寬。它采用存算融合的設(shè)計(jì),可以整合計(jì)算節(jié)點(diǎn)內(nèi)的存儲(chǔ)資源,構(gòu)建全局命名空間的近線存儲(chǔ)池,實(shí)現(xiàn)靈活配置數(shù)量來擴(kuò)展GPU/CPU計(jì)算資源和存儲(chǔ)資源,以滿足動(dòng)態(tài)擴(kuò)展的業(yè)務(wù)需求。PLStor GS9200數(shù)據(jù)湖存儲(chǔ)支持塊、文件、對(duì)象、大數(shù)據(jù)等存儲(chǔ)協(xié)議,并且支持POSI/NFS/CIFS/HDFS/S3/Swift等多種協(xié)議互通,實(shí)現(xiàn)平臺(tái)高效管理,而且保證在數(shù)據(jù)安全性、高并發(fā)讀寫、高空間利用率三者皆得,滿足不同場景下的數(shù)據(jù)安全存儲(chǔ)和訪問需求。
大模型發(fā)展如火如荼,成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,大模型競相上線開放服務(wù)標(biāo)志著大模型應(yīng)用時(shí)代即將到來。寶德計(jì)算將乘勢而上,繼續(xù)發(fā)揮技術(shù)優(yōu)勢和市場經(jīng)驗(yàn),打造先進(jìn)的AI全棧算力方案,助力推動(dòng)大模型的落地應(yīng)用,為中國AI產(chǎn)業(yè)創(chuàng)新應(yīng)用提供源源不斷的新動(dòng)力!