時(shí)間:2024-03-12來(lái)源:本站
當(dāng)前,AI大模型發(fā)展如火如荼,“百模大戰(zhàn)”仍在繼續(xù)。而大模型發(fā)展的背后是龐大的算力支撐。隨著大模型迭代速度越來(lái)越快,參數(shù)越來(lái)越大,對(duì)智能算力提出了更高性能的挑戰(zhàn)。作為中國(guó)領(lǐng)先的AI算力提供商和AI服務(wù)器TOP2企業(yè),寶德應(yīng)需而動(dòng),隆重推出了寶德自強(qiáng)®昇騰AI推理服務(wù)器PR425KI G2,助力大模型賦能千行百業(yè)。
更高算力密度
PR425KI G2基于鯤鵬+昇騰處理器打造,采用8模組高效推理方式,支持8*32GB HBM片內(nèi)存和32個(gè)DDR4系統(tǒng)內(nèi)存插槽,可以提供強(qiáng)勁的AI推理能力。在緊湊的4U空間內(nèi),其內(nèi)部集成了圖像&視頻預(yù)處理器,外部通信模塊、硬件加速器、芯片管理核等模塊,具備完整的SOC功能,能高效加速AI應(yīng)用。
極致能效比
PR425KI G2配置高效節(jié)能電源、動(dòng)態(tài)冷卻機(jī)制,提供0.6 PFLOPS/ kW超高能效比,在保持其性能的同時(shí),大大節(jié)省運(yùn)營(yíng)費(fèi)用;同時(shí),還采用智能散熱系統(tǒng),根據(jù)熱關(guān)鍵器件溫度綜合調(diào)節(jié)風(fēng)扇轉(zhuǎn)速,節(jié)能的同時(shí)降低了噪音并提高風(fēng)扇的可靠性。
高速網(wǎng)絡(luò)帶寬
PR425KI G2配備了8*200GE RoCE v2高速接口,通過HCCS Full mesh互聯(lián)模式,實(shí)現(xiàn)了8路NPU之間的無(wú)縫連接,極大地提升了數(shù)據(jù)傳輸速度和模型推理效率,讓復(fù)雜計(jì)算任務(wù)處理如行云流水,助力企業(yè)快速洞察數(shù)據(jù)價(jià)值,搶占市場(chǎng)先機(jī)。
針對(duì)高性能大模型推理場(chǎng)景,PR425KI G2是33B以上高性能大模型應(yīng)用推理的理想選擇。PR425KI G2具備強(qiáng)大計(jì)算能力、高能效比和高網(wǎng)絡(luò)帶寬等優(yōu)勢(shì),能夠輕松應(yīng)對(duì)高性能大模型推理帶來(lái)的挑戰(zhàn),提供穩(wěn)定可靠的算力支持。它不僅能夠幫助企業(yè)快速構(gòu)建智能客服系統(tǒng),提升客戶服務(wù)體驗(yàn),還能助力內(nèi)容創(chuàng)作者實(shí)現(xiàn)文案與創(chuàng)意的自動(dòng)化生成,加速知識(shí)管理與沉淀過程,為各行各業(yè)的數(shù)字化轉(zhuǎn)型插上翅膀。
未來(lái),寶德將繼續(xù)充分發(fā)揮自身技術(shù)優(yōu)勢(shì),加大研發(fā)創(chuàng)新,不斷推出更多性能強(qiáng)勁、安全可靠的算力產(chǎn)品和方案,助推更多大模型場(chǎng)景落地和應(yīng)用,促進(jìn)千行百業(yè)數(shù)字變革,為我國(guó)人工智能產(chǎn)業(yè)的發(fā)展注入強(qiáng)勁的動(dòng)力。