天數(shù)智芯聯(lián)合無問芯穹完成智鎧GPU百卡推理集群測試與適配,支持多場景大規(guī)模實時推理
2024-12-09 14:18:10AI云資訊14152

近日,天數(shù)智芯與無問芯穹達成重要合作,在天數(shù)智芯智鎧GPU百卡推理集群上成功部署了無問芯穹Infini-AI異構(gòu)云平臺,并實現(xiàn)了多種主流大模型在該推理集群上的全功能適配,并正式對外提供MaaS服務(wù)。雙方此次合作,旨在協(xié)力構(gòu)建一個以自主芯片為核心的大模型服務(wù)生態(tài),進一步推動我國人工智能產(chǎn)業(yè)的快速發(fā)展。

Infini-AI異構(gòu)云平臺是無問芯穹開發(fā)的一個基于多芯片算力底座的一站式大模型開發(fā)與服務(wù)平臺,它打破了傳統(tǒng)計算資源的限制,實現(xiàn)了對多種模型和計算卡的全面支持。
天數(shù)智芯自主研發(fā)的智鎧100GPU,支持多種精度數(shù)據(jù)類型,靈活支持各種模型算法,兼容國內(nèi)外主流AI生態(tài),滿足從基礎(chǔ)研究到實際應(yīng)用的全方位需求。
早在2024年7月,無問芯穹Infini-AI異構(gòu)云平臺就與天數(shù)智芯合作,打造了可進行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的大模型訓(xùn)練平臺,千卡異構(gòu)混合訓(xùn)練集群算力利用率最高達到了97.6%。
在本次合作中,經(jīng)過雙方嚴(yán)格的功能和性能測試,完成了智鎧100 GPU產(chǎn)品與無問芯穹Infini-AI異構(gòu)云平臺的全面接入。該集群可靈活支持對話問答、數(shù)據(jù)標(biāo)注、內(nèi)容理解與分析,信息抽取等主流任務(wù)場景,滿足文本、圖片、視頻等多場景下的大規(guī)模實時推理需求。?當(dāng)前,智鎧100現(xiàn)已在無問芯穹Infini-AI異構(gòu)云平臺上線,可支持7B-72B參數(shù)的模型推理,用于更佳效果的數(shù)據(jù)生成與處理。Infini-AI是高性能算力和原生工具鏈平臺,其中大模型服務(wù)平臺可為應(yīng)用開發(fā)者提供各種高性能、易上手、安全可靠的大模型服務(wù),能力覆蓋從大模型開發(fā)到大模型服務(wù)化部署的全流程?,F(xiàn)已收錄包括Stable Diffusion、Qwen2.5、CogvideoX、Llama3.1在內(nèi)的多種主流大模型,支持模型一鍵微調(diào)部署、模型與ComfyUI workflow托管等功能。
平臺用戶可以屏蔽硬件生態(tài)影響,通過極少步驟操作調(diào)用各種模型API,實現(xiàn)模型的快速部署。同時,還能享受到與國際主流產(chǎn)品相比,具有更高性價比的算力服務(wù)。隨著人工智能技術(shù)的快速發(fā)展及應(yīng)用場景的拓展,國內(nèi)大模型技術(shù)與應(yīng)用企業(yè)對高可控性、高效能、高性價比、高附加值的算力需求日益迫切。雙方此次合作極大地降低了AI應(yīng)用的技術(shù)門檻和使用成本,更為自主芯片在人工智能領(lǐng)域的廣泛應(yīng)用開辟了新的道路。展望未來,天數(shù)智芯與無問芯穹將繼續(xù)全面合作,在智算中心、央國企、互聯(lián)網(wǎng)等領(lǐng)域,共建AGI時代的大模型算力基座、探索并推動應(yīng)用普及和創(chuàng)新發(fā)展、加速行業(yè)的數(shù)字化轉(zhuǎn)型步伐。
相關(guān)文章
- 昇騰助力中科大團隊實現(xiàn)MoE 稀疏大模型并行推理提速超30%
- 大模型推理成本居高不下,浪潮存儲幫你來突圍!
- 首次商用試運行,類腦智算集群支持大模型快速推理服務(wù)
- 九章云極位列AI基礎(chǔ)設(shè)施第一梯隊!IDC發(fā)布中國大模型推理算力報告
- OpenAI推出GPT-5,奧爾特曼盛贊為寫作、編程及人類級推理的最佳模型
- 商湯大裝置三項滿分!IDC首次發(fā)布中國大模型推理算力報告
- 云天勵飛擬赴港上市:中國AI推理芯片獨角獸
- 引領(lǐng)大模型推理效率革命!浪潮存儲發(fā)布國內(nèi)首款推理加速存儲AS3000G7
- 青云科技與信通院、焱融啟動 AI 推理場景高性能存儲技術(shù)推進計劃
- 云天勵飛AI推理芯片亮相聯(lián)合國舞臺,為全球AI普惠貢獻中國智慧
- 模型推理協(xié)作正式開啟,魔樂社區(qū),讓模型跑遍“中國芯”
- 超低延時重構(gòu)AI推理體驗!白山云發(fā)布“大模型API”產(chǎn)品
- 國內(nèi)首家!商湯科技大裝置萬象獲得中國信通院“大模型推理平臺”最高評級認(rèn)證
- ACL 2025 | 騰訊優(yōu)圖實驗室大模型4篇論文入選,涵蓋智能體、角色扮演、自動推理等方向
- AI算力新篇章:云天勵飛搶灘推理時代,開啟廣闊“芯”藍海
- AMD首席執(zhí)行官蘇姿豐預(yù)測:受推理需求驅(qū)動,人工智能數(shù)據(jù)中心加速器市場規(guī)模2028年將突破5000億美元
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案