華為云基于CloudMatrix384的昇騰AI云服務(wù)全面上線
2025-06-21 17:36:14AI云資訊1074
在6月20日舉行的華為開發(fā)者大會(huì)2025(HDC 2025)上,華為常務(wù)董事、華為云計(jì)算 CEO張平安宣布基于CloudMatrix384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)全面上線,為大模型應(yīng)用提供澎湃算力。
隨著大模型訓(xùn)練和推理對(duì)算力需求的爆炸式增長(zhǎng),傳統(tǒng)計(jì)算架構(gòu)已難以支撐AI技術(shù)的代際躍遷。華為云新一代昇騰AI云服務(wù)基于CloudMatrix384超節(jié)點(diǎn),首創(chuàng)將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網(wǎng)絡(luò)MatrixLink全對(duì)等互聯(lián),形成一臺(tái)超級(jí)“AI服務(wù)器”,單卡推理吞吐量躍升到2300Tokens/s。超節(jié)點(diǎn)架構(gòu)能更好地支持混合專家MoE大模型的推理,可以實(shí)現(xiàn)“一卡一專家”,一個(gè)超節(jié)點(diǎn)可以支持384個(gè)專家并行推理,極大提升效率。同時(shí),超節(jié)點(diǎn)還可以支持“一卡一算力任務(wù)”,靈活分配資源,提升任務(wù)并行處理,減少等待,將算力有效使用率(MFU)提升50%以上。
對(duì)于萬億、十萬億參數(shù)的大模型訓(xùn)練任務(wù),在云數(shù)據(jù)中心,還能將432個(gè)超節(jié)點(diǎn)級(jí)聯(lián)成最高16萬卡的超大集群;同時(shí),超節(jié)點(diǎn)還可以支持訓(xùn)推算力一體部署,如“日推夜訓(xùn)”,訓(xùn)推算力可靈活分配,幫助客戶資源使用最優(yōu)。
張平安表示,昇騰AI云服務(wù)得到了全球客戶、伙伴和開發(fā)者的支持。正是因?yàn)樗麄儗?duì)華為的堅(jiān)定信任,才有機(jī)會(huì)讓昇騰構(gòu)筑起一個(gè)比肩巔峰,開創(chuàng)未來的AI算力底座!
新浪與華為云深度合作,基于CloudMatrix384昇騰AI云服務(wù),為“智慧小浪”智能服務(wù)體系構(gòu)建了統(tǒng)一的推理平臺(tái),底層由昇騰AI算力提供支持。推理的交付效率提升了超過 50%,模型上線速度成倍加快;通過軟硬協(xié)同調(diào)優(yōu),NPU利用率提升超過40%,每一份資源都得到更高效的使用。
硅基流動(dòng)正在使用CloudMatrix384超節(jié)點(diǎn),為數(shù)百萬用戶高效提供DeepSeekV3、R1的推理服務(wù)。面壁智能使用CloudMatrix384超節(jié)點(diǎn),讓他們的小鋼炮模型的推理業(yè)務(wù)性能得到了2.7倍提升。
在科研領(lǐng)域,中科院基于CloudMatrix384超節(jié)點(diǎn)打造了自己的模型訓(xùn)練框架,快速構(gòu)建了中科院AI forScience科研大模型,擺脫了對(duì)國(guó)外高性能AI算力平臺(tái)的依賴。
在互聯(lián)網(wǎng)領(lǐng)域,360打造的納米AI搜索,為用戶提供超級(jí)AI搜索服務(wù),對(duì)AI算力有極大需求,也已開啟了CloudMatrix384超節(jié)點(diǎn)的測(cè)試。
當(dāng)前,昇騰AI云服務(wù)已經(jīng)成為AI基礎(chǔ)設(shè)施的最優(yōu)選擇,為超過1300家客戶提供澎湃的AI算力,加速千行萬業(yè)智能化升級(jí)。
相關(guān)文章
- 華為Mate XTs 非凡大師發(fā)布,華為云空間帶來安全便捷的云端數(shù)據(jù)管理體驗(yàn)
- Data+AI協(xié)同創(chuàng)新,華為云穩(wěn)居中國(guó)大數(shù)據(jù)平臺(tái)市場(chǎng)榜首
- 金蝶企業(yè)管理AI亮相2025數(shù)博會(huì),攜手華為云共助企業(yè)智能化變革
- 明源云攜手華為云:加速國(guó)資國(guó)企數(shù)字化轉(zhuǎn)型,智贏新時(shí)代
- 華為云GrowCloud&GoCloud伙伴云上協(xié)同大會(huì)圓滿收官,與伙伴能力共生,商業(yè)共贏
- 華為云肖霏:把握智能時(shí)代生產(chǎn)要素更新,激發(fā)Data+AI雙飛輪協(xié)同發(fā)展
- 四維圖新亮相2025貴陽數(shù)博會(huì) 攜手華為云發(fā)布貴安汽車專區(qū)
- 中汽科技(上海)與華為云簽署合作協(xié)議,共同打造中國(guó)首個(gè)汽車行業(yè)跨境數(shù)據(jù)空間
- 華為云張平安:堅(jiān)持打造“算力黑土地”,加速行業(yè)智能躍遷
- 華為云張平安:打造算力黑土地,繁榮AI百花園,加速行業(yè)智能躍遷
- 從1920TPS到2400TPS,華為云Tokens服務(wù)全面接入384超節(jié)點(diǎn)
- 打造“Token之都”,華為云助力烏蘭察布成為綠色AI算力新高地
- 國(guó)有六大行核心系統(tǒng)轉(zhuǎn)型:華為云GaussDB應(yīng)用占比居首,Oracle僅存少量業(yè)務(wù)
- 云端進(jìn)化?智見未來 | 華為云數(shù)字化轉(zhuǎn)型總裁班成功舉辦,共探企業(yè)成長(zhǎng)之路
- 華為云北方首批超節(jié)點(diǎn)AI智算中心開服,新一代CloudMatrix 384昇騰AI云服務(wù)點(diǎn)亮“綠色引擎”
- 華為云香港伙理工大學(xué)簽署合作備忘錄
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場(chǎng)景AI,傳音手機(jī)推動(dòng)前沿科技落地新興市場(chǎng)
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計(jì)白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國(guó)
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會(huì)隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營(yíng)報(bào)名企業(yè)超300家
- 首都機(jī)場(chǎng)“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國(guó)首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級(jí)!率先適配 “液態(tài)玻璃”,原生體驗(yàn)更極致
- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢(shì)科技,提升科研數(shù)據(jù)處理效能