飆升4倍！中國(guó)電信星辰MaaS×?xí)N騰并行引爆DeepSeek“超能力”

2025-07-15 中國(guó)電信政企服務(wù)

當(dāng)前，DeepSeek已全面邁入大規(guī)模應(yīng)用階段，推理需求呈現(xiàn)爆發(fā)式增長(zhǎng)，高性價(jià)比的推理方案炙手可熱。在國(guó)家加速構(gòu)建自主創(chuàng)新算力體系的戰(zhàn)略背景下，中國(guó)電信攜手華為開(kāi)展核心技術(shù)攻關(guān)，星辰MaaS平臺(tái)+昇騰解鎖DeepSeek超強(qiáng)推理能力，完成DeepSeek模型基于昇騰大規(guī)模專家并行（后文簡(jiǎn)稱“大EP”）解決方案的驗(yàn)證，以硬核實(shí)力重塑AI推理新標(biāo)桿，以高效率賦能千行百業(yè)！

大規(guī)模專家并行推理（Large-Scale Expert Parallel Inference）是一種針對(duì)大規(guī)模深度學(xué)習(xí)模型的高效推理技術(shù)，尤其適用于DeepSeek-R1等基于混合專家架構(gòu)的大模型?！皩＜摇奔椿旌蠈＜襇OE架構(gòu)中的功能性子模型，通過(guò)分工協(xié)作實(shí)現(xiàn)高效計(jì)算和更強(qiáng)的任務(wù)處理能力。

該推理技術(shù)的核心思想是將模型中的多個(gè)“專家”子網(wǎng)絡(luò)分布到不同的AI卡上，降低單卡的計(jì)算和內(nèi)存壓力，通過(guò)并行計(jì)算和動(dòng)態(tài)路由機(jī)制，實(shí)現(xiàn)高并發(fā)、高吞吐、低時(shí)延的推理性能。

在大EP方案實(shí)施過(guò)程中，涉及到多專家的協(xié)同和調(diào)度、跨節(jié)點(diǎn)通信等難題：

通信開(kāi)銷(xiāo)，“網(wǎng)絡(luò)擁堵”

“專家并行化”需要節(jié)點(diǎn)間頻繁通信，但如果專家很多，將造成通信頻次過(guò)高，形成類似交通擁堵的資源競(jìng)爭(zhēng)狀態(tài)，大量時(shí)間將消耗在通信等待中。

專家分配：負(fù)載失衡

在動(dòng)態(tài)路由機(jī)制下，數(shù)據(jù)被動(dòng)態(tài)分配給專家，可能出現(xiàn)“明星專家”被瘋狂投喂任務(wù)，而其他專家模塊處于低負(fù)載閑置狀態(tài)。

系統(tǒng)復(fù)雜，協(xié)同瓶頸

在大規(guī)模部署時(shí)，跨專家協(xié)作、容錯(cuò)與資源調(diào)度的協(xié)同管理，成為關(guān)鍵的“工程瓶頸”。

三大核“芯”術(shù) 智算提效破局

若上述難題未得到有效解決，“專家并行化”的潛力將難以充分釋放。為此，亟需通過(guò)新的算法優(yōu)化和系統(tǒng)設(shè)計(jì)，以降低通信成本、實(shí)現(xiàn)智能負(fù)載均衡，并構(gòu)建更魯棒的分布式訓(xùn)練框架。中國(guó)電信聯(lián)合昇騰利用三大黑科技，讓智算資源效率大大提升：

PD分離（預(yù)填充和解碼分離）

PD分離技術(shù)作為一種創(chuàng)新的架構(gòu)設(shè)計(jì)，通過(guò)將大模型推理過(guò)程分解為兩個(gè)獨(dú)立的階段，并針對(duì)每個(gè)階段的特性進(jìn)行專門(mén)優(yōu)化，如同將“倉(cāng)庫(kù)與加工車(chē)間分開(kāi)”，能夠有效提升系統(tǒng)資源利用率。

多專家并行優(yōu)化（智能任務(wù)調(diào)度）

“讓專業(yè)的人做專業(yè)的事”，系統(tǒng)將圖像識(shí)別、文本理解等不同任務(wù)分配給對(duì)應(yīng)領(lǐng)域的專家處理。同時(shí)采用親和部署策略，將高頻通信的模塊盡量部署在同一臺(tái)物理設(shè)備上，減少通信開(kāi)銷(xiāo)。實(shí)測(cè)表明，資源利用率可提升20%。

融合算子（復(fù)合計(jì)算加速技術(shù)）

MLAPO(加速算子)將13個(gè)小算子融合成一個(gè)超級(jí)大算子，如同“產(chǎn)線工人升級(jí)為全流程操作手”，單次計(jì)算的同時(shí)能完成多項(xiàng)操作。在DeepSeek模型的量化場(chǎng)景下，該技術(shù)使計(jì)算耗時(shí)從109微秒縮減為45微秒，計(jì)算速度提升70%。

雙場(chǎng)景實(shí)戰(zhàn) 性能飆升四倍

在實(shí)戰(zhàn)環(huán)境中，本次實(shí)驗(yàn)基于星辰MaaS平臺(tái)，分別采用傳統(tǒng)混合部署方案和大EP專家并行方案，基于DeepSeek R1進(jìn)行推理性能測(cè)試，如下：

在輸入2K、輸出2K場(chǎng)景下

單卡平均端到端吞吐提升3.71倍；適合在線客服、智能問(wèn)答等高頻短文本交互。

在輸入4K、輸出2K場(chǎng)景下

單卡平均端到端吞吐提升3.53倍；攻克長(zhǎng)文檔摘要、代碼生成等企業(yè)級(jí)剛需。

經(jīng)過(guò)實(shí)測(cè)驗(yàn)證，單卡吞吐性能提升近4倍！

多維度應(yīng)用實(shí)現(xiàn)“算力自由”

在互聯(lián)網(wǎng)、科技行業(yè)，大EP方案特別適用于高并發(fā)場(chǎng)景，如智能客服和AI內(nèi)容生成。相比傳統(tǒng)GPU集群，該方案能大幅降低單卡顯存占用，支持更高的用戶請(qǐng)求并發(fā)量，提升響應(yīng)速度與用戶體驗(yàn)，同時(shí)降低50%以上的硬件成本。

對(duì)于金融、要客等對(duì)數(shù)據(jù)隱私要求嚴(yán)格的行業(yè)，大EP方案支持私有化部署，通過(guò)多專家并行技術(shù)，可在保持同等推理性能的情況下減少40%的AI卡投入，既滿足國(guó)產(chǎn)化要求，又顯著降低硬件投資成本，縮短回報(bào)周期。

此外，星辰MaaS平臺(tái)提供開(kāi)箱即用的大EP方案，適用于政務(wù)、農(nóng)業(yè)、文宣等行業(yè)，用戶無(wú)需自建算力，通過(guò)API即可快速集成，實(shí)現(xiàn)零運(yùn)維、按需付費(fèi)的彈性服務(wù)，整體成本僅為自建算力的1/3，尤其適合預(yù)算有限但需要高并發(fā)支持的場(chǎng)景。

無(wú)論是互聯(lián)網(wǎng)大模型的高并發(fā)推理，還是企業(yè)私有化大模型的服務(wù)，大EP方案都能以更低成本、更高效率滿足大規(guī)模推理并發(fā)性能需求。國(guó)產(chǎn)智算+自研技術(shù)，加速AI推理規(guī)模應(yīng)用，真正實(shí)現(xiàn)“算力自由”！

中國(guó)電信星辰MaaS平臺(tái)+星辰行業(yè)智能體平臺(tái)+DeepSeek+昇騰大EP方案，為企業(yè)客戶提供一站式算力+數(shù)據(jù)+模型+平臺(tái)+應(yīng)用端到端解決方案及極致性能推理服務(wù)，讓AI應(yīng)用的搭建快速、簡(jiǎn)捷，高效。

掃一掃在手機(jī)打開(kāi)當(dāng)前頁(yè)

關(guān)鍵詞 : DeepSeek;政企

敬請(qǐng)關(guān)注以下平臺(tái)的“中國(guó)電信”官方自媒體賬號(hào)，與我們互動(dòng)交流：

新浪微博

今日頭條

騰訊微信

創(chuàng)新業(yè)務(wù)推薦

精彩專題

2024年中國(guó)國(guó)際信息通信展覽會(huì)專題-手機(jī)端 300_190.jpg

2024中國(guó)國(guó)際信息通信展

2024年9月25日，2024年中國(guó)國(guó)際信息通信展覽會(huì)在北京盛大開(kāi)幕。在這場(chǎng)被譽(yù)為“行業(yè)變化的晴雨表、技術(shù)演進(jìn)的風(fēng)向標(biāo)”的年度盛會(huì)上，中國(guó)電信以“智云筑國(guó)基星辰啟未來(lái)...

高質(zhì)量發(fā)展看電信

中國(guó)電信助力各地經(jīng)濟(jì)高質(zhì)量發(fā)展，運(yùn)用5G+AI等高科技技術(shù)手段幫助貴州、山東、湖南、陜西等地的企業(yè)和鄉(xiāng)村產(chǎn)業(yè)發(fā)展。中國(guó)電信用實(shí)際行動(dòng)讓智能技術(shù)切實(shí)為人民群眾服務(wù)，...

伊人黄片,天天做,天天射,韩日,亚洲一区二区成人,日韩夜夜操,午夜福利在线导航,4huw中文无码,一本精品无码高清

飆升4倍！中國(guó)電信星辰MaaS×?xí)N騰并行引爆DeepSeek“超能力”

敬請(qǐng)關(guān)注以下平臺(tái)的“中國(guó)電信”官方自媒體賬號(hào)，與我們互動(dòng)交流：

2024中國(guó)國(guó)際信息通信展

高質(zhì)量發(fā)展看電信

溫馨提示

飆升4倍！中國(guó)電信星辰MaaS×?xí)N騰并行引爆DeepSeek“超能力”

敬請(qǐng)關(guān)注以下平臺(tái)的“中國(guó)電信”官方自媒體賬號(hào)，與我們互動(dòng)交流：