基石智算打造智能AI算力管理新范式,發(fā)布AI智算平臺2.0
2024-06-05 23:04:08AI云資訊10717
基石智算全新升級的AI 智算平臺2.0 正式發(fā)布!
AI 智算平臺致力于讓 AI 算力管理像本地資源管理一樣簡單。2.0 新版全面擁抱云原生,實現(xiàn)從 AI 基礎(chǔ)設(shè)施到 AI 開發(fā)訓(xùn)練推理的全流程高效管理。
功能升級,重塑算力管理體驗
異構(gòu)算力管理與調(diào)度,靈活高效
平臺通過統(tǒng)一的集群管理,實現(xiàn)對 NVIDIA、國產(chǎn) GPU 等多種異構(gòu)算力的高效調(diào)度。無論是高速 IB、RoCE 網(wǎng)絡(luò)建設(shè),還是并行文件存儲集群管理,平臺均能提供從物理機到容器的全方位管理。新版平臺支持共享 GPU、單卡、多卡、多節(jié)點的算力調(diào)度,用戶可根據(jù)實際業(yè)務(wù)需求按需申請使用,極大地提高了算力資源的使用效率。
細致監(jiān)控,全面守護 AI 基礎(chǔ)設(shè)施
基石智算(coreshub.cn)AI 智算平臺2.0 新增節(jié)點監(jiān)控、任務(wù)監(jiān)控、容器組監(jiān)控、高速網(wǎng)絡(luò)監(jiān)控和 GPU 監(jiān)控等功能,提供從硬件故障處理到資源使用情況的全方位監(jiān)控,及時發(fā)現(xiàn)并解決潛在問題。同時,可視化的自定義告警配置支持郵件、企微、webhook等多種通知渠道,確保用戶隨時掌握 AI 基礎(chǔ)設(shè)施的運行狀態(tài)。
集群監(jiān)控
網(wǎng)絡(luò)監(jiān)控
自定義告警配置
豐富的 AI 業(yè)務(wù)支持,加速創(chuàng)新
在算力調(diào)度的基礎(chǔ)上,平臺支持自定義鏡像倉庫,同時內(nèi)置 TensorFlow、PyTorch、MPI、DeepSpeed 等常用計算框架,支持一鍵創(chuàng)建開發(fā)機、分布式任務(wù),自動掛載并行文件存儲等常用 AI 業(yè)務(wù)流程。用戶只需上傳代碼,即可快速啟動多機多節(jié)點的分布式訓(xùn)練,系統(tǒng)將自動調(diào)度到可用 GPU 進行計算,任務(wù)完成后自動釋放資源。這種自動化的算力調(diào)度分發(fā)與回收機制,讓算法工程師能夠更專注于 AI 模型本身,加速科研成果的創(chuàng)新。
常用分布式計算環(huán)境與框架
快速啟動分布式任務(wù)
資源總覽
便捷模型服務(wù),一鍵部署,輕松推理
模型服務(wù)功能的優(yōu)化,讓用戶可以一鍵部署在線推理服務(wù),極大地提升了模型開發(fā)和部署的效率。無論是公開模型還是用戶上傳的自有模型,均可在線推理,滿足各類業(yè)務(wù)需求。
模型服務(wù)-模型廣場
自動化運營,計量計費服務(wù)
借助基石智算專區(qū)運營經(jīng)驗,平臺提供規(guī)格定價、在線充值、購買產(chǎn)品的全流程自服務(wù)管理,減少運營的技術(shù)人員、管理人員投入,同時減少客戶試用溝通和準備環(huán)境的時間,加快算力中心資源售賣,提升資源運營效率。
費用中心
構(gòu)建高效智能的 AI 基礎(chǔ)設(shè)施
簡化算力建設(shè),跨越技術(shù)鴻溝
如同管理本地資源一樣,AI 智算平臺讓用戶即使面對復(fù)雜的 AI 基礎(chǔ)設(shè)施,也能輕松上手。無論是硬件配置、異構(gòu)計算資源、網(wǎng)絡(luò)架構(gòu)還是存儲資源,一切盡在掌握,大大降低了 AI 算力建設(shè)的技術(shù)門檻。
成本與效率雙輪驅(qū)動
通過精細化監(jiān)控與智能調(diào)度,平臺能夠根據(jù)實際負載自動調(diào)整算力資源,避免資源浪費,同時提供財務(wù)管理工具,不僅支持價格設(shè)定,還支持詳盡的用戶消費查詢與賬單統(tǒng)計,能有效控制成本,提升整體運營效率。
低門檻,模型全周期護航
從模型開發(fā)、訓(xùn)練到部署推理,平臺提供了一站式解決方案。AI 智算平臺的大模型服務(wù)支持模型的快速訓(xùn)練、版本管理、在線推理服務(wù),以及靈活的資源組配置,讓模型管理變得簡單高效,加速 AI 應(yīng)用的商業(yè)化進程。
運維效率與穩(wěn)定性提升
自動化運維體系減少人工干預(yù),自動執(zhí)行和處理日常運維任務(wù),如資源分配、故障處理等,確保系統(tǒng)的高可用性和穩(wěn)定性,讓團隊更加聚焦于業(yè)務(wù)創(chuàng)新與優(yōu)化。
借助 AI 智算平臺2.0,企業(yè)可以輕松應(yīng)對 AI 算力建設(shè)與運營的挑戰(zhàn),實現(xiàn)高效、靈活的 AI 算力管理,降低成本,提高競爭力。
相關(guān)文章
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場景AI,傳音手機推動前沿科技落地新興市場
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機房參考設(shè)計白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能