首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 云計算 >> 正文

華為云基于CloudMatrix384的昇騰AI云服務(wù)全面上線

2025年6月20日 16:58  CCTIME飛象網(wǎng)  

在6月20日舉行的華為開發(fā)者大會2025(HDC 2025)上,華為常務(wù)董事、華為云計算 CEO張平安宣布基于CloudMatrix384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)全面上線,為大模型應(yīng)用提供澎湃算力。

隨著大模型訓(xùn)練和推理對算力需求的爆炸式增長,傳統(tǒng)計算架構(gòu)已難以支撐AI技術(shù)的代際躍遷。華為云新一代昇騰AI云服務(wù)基于CloudMatrix384超節(jié)點(diǎn),首創(chuàng)將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網(wǎng)絡(luò)MatrixLink全對等互聯(lián),形成一臺超級“AI服務(wù)器”,單卡推理吞吐量躍升到2300 Tokens/s。超節(jié)點(diǎn)架構(gòu)能更好地支持混合專家MoE大模型的推理,可以實現(xiàn)“一卡一專家”,一個超節(jié)點(diǎn)可以支持384個專家并行推理,極大提升效率。同時,超節(jié)點(diǎn)還可以支持“一卡一算力任務(wù)”,靈活分配資源,提升任務(wù)并行處理,減少等待,將算力有效使用率(MFU)提升50%以上。

對于萬億、十萬億參數(shù)的大模型訓(xùn)練任務(wù),在云數(shù)據(jù)中心,還能將432個超節(jié)點(diǎn)級聯(lián)成最高16萬卡的超大集群;同時,超節(jié)點(diǎn)還可以支持訓(xùn)推算力一體部署,如“日推夜訓(xùn)”,訓(xùn)推算力可靈活分配,幫助客戶資源使用最優(yōu)。

張平安表示,昇騰AI云服務(wù)得到了全球客戶、伙伴和開發(fā)者的支持。正是因為他們對華為的堅定信任,才有機(jī)會讓昇騰構(gòu)筑起一個比肩巔峰,開創(chuàng)未來的AI算力底座!

新浪與華為云深度合作,基于CloudMatrix384昇騰AI云服務(wù),為“智慧小浪”智能服務(wù)體系構(gòu)建了統(tǒng)一的推理平臺,底層由昇騰AI算力提供支持。推理的交付效率提升了超過 50%,模型上線速度成倍加快;通過軟硬協(xié)同調(diào)優(yōu),NPU利用率提升超過40%,每一份資源都得到更高效的使用。

硅基流動正在使用CloudMatrix384超節(jié)點(diǎn),為數(shù)百萬用戶高效提供DeepSeek V3、R1的推理服務(wù)。面壁智能使用CloudMatrix384超節(jié)點(diǎn),讓他們的小鋼炮模型的推理業(yè)務(wù)性能得到了2.7倍提升。

在科研領(lǐng)域,中科院基于CloudMatrix384超節(jié)點(diǎn)打造了自己的模型訓(xùn)練框架,快速構(gòu)建了中科院AI for Science科研大模型,擺脫了對國外高性能AI算力平臺的依賴。

在互聯(lián)網(wǎng)領(lǐng)域,360打造的納米AI搜索,為用戶提供超級AI搜索服務(wù),對AI算力有極大需求,也已開啟了CloudMatrix384超節(jié)點(diǎn)的測試。

當(dāng)前,昇騰AI云服務(wù)已經(jīng)成為AI基礎(chǔ)設(shè)施的最優(yōu)選擇,為超過1300家客戶提供澎湃的AI算力,加速千行萬業(yè)智能化升級。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
韋樂平:大模型時代將開啟新一波“光進(jìn)銅退”
精彩視頻
2025MWC上海丨智能加速度 中興通訊展臺直擊
2025MWC上海|京信通信:AI賦能5G-A 重構(gòu)連接的價值
飛象訪談 | 全域智聯(lián):羅德與施瓦茨解決方案臻享快閃
還在用舊款手機(jī)?恭喜你!在MWC上?凑,讀GSMA報告
精彩專題
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會
2025世界電信和信息社會日大會
第八屆數(shù)字中國建設(shè)峰會
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像