以技術(shù)創(chuàng)新為驅(qū)動,持中立姿態(tài),金山云助力大模型發(fā)展落地 原創(chuàng)
2024-09-27 11:54:30AI云資訊26939
近期,金山云發(fā)布了最新財(cái)報(bào),二季度,金山云人工智能業(yè)務(wù)的表現(xiàn)尤為突出。據(jù)財(cái)報(bào)數(shù)據(jù)顯示,人工智能業(yè)務(wù)收入已增長至3.26億元,占公有云收入的比例高達(dá)26%,且較上一季度實(shí)現(xiàn)了翻倍的顯著增長。
這一亮眼成績,與金山云堅(jiān)定推進(jìn)業(yè)務(wù)戰(zhàn)略調(diào)整密不可分。金山云高級副總裁劉濤在采訪時表示,自2022年開始,金山云便著手進(jìn)行業(yè)務(wù)整頓,主動收縮CDN業(yè)務(wù)規(guī)模,并嚴(yán)格篩選行業(yè)云項(xiàng)目,積極把握人工智能帶來的機(jī)遇。金山云將更多資源投入到計(jì)算、大數(shù)據(jù)、數(shù)據(jù)庫及AI等高利潤率、高壁壘的產(chǎn)品領(lǐng)域。這一戰(zhàn)略調(diào)整,顯然為金山云在人工智能業(yè)務(wù)上的迅猛發(fā)展打下了堅(jiān)實(shí)基礎(chǔ)。
金山云高級副總裁劉濤
技術(shù)創(chuàng)新突破,深耕大模型服務(wù)領(lǐng)域
為了更好地服務(wù)大模型客戶,金山云在多方面深耕細(xì)作,緊跟用戶需求,持續(xù)推動技術(shù)創(chuàng)新與突破,這不僅助力了眾多大模型企業(yè)高效完成訓(xùn)練和推理工作,更為大模型時代的全面到來注入了強(qiáng)勁動力。
大模型時代,企業(yè)對算力的需求旺盛。劉濤強(qiáng)調(diào),算力業(yè)務(wù)并不是簡單地售賣設(shè)備,而是涵蓋了算力供給、規(guī)模組網(wǎng)能力、存儲以及平臺能力等多個復(fù)雜而關(guān)鍵的環(huán)節(jié)。
在算力供給方面,金山云能夠針對客戶不同場景中的需求,通過異構(gòu)算力實(shí)現(xiàn)計(jì)算效力最大化,確保算力資源的穩(wěn)定與充足。
在規(guī)模組網(wǎng)能力方面,金山云通過深入的技術(shù)研發(fā),有效解決了穩(wěn)定性、工程實(shí)施準(zhǔn)確性等一系列挑戰(zhàn)。特別是在網(wǎng)絡(luò)部署方面,金山云能應(yīng)對大規(guī)模集群部署帶來的網(wǎng)絡(luò)部署和抖動等難題。
眾所周知,大模型訓(xùn)練面臨著互通互聯(lián)的挑戰(zhàn),需要高性能的網(wǎng)絡(luò)通信來支持?jǐn)?shù)據(jù)傳輸和同步。金山云從成本和開放性的角度出發(fā),選擇了RoCE網(wǎng)技術(shù),并且在多個項(xiàng)目中成功實(shí)踐。此外,金山云自研的RoCE網(wǎng)絡(luò)監(jiān)控平臺提供集群端側(cè)和網(wǎng)側(cè)的基礎(chǔ)信息與指標(biāo)、網(wǎng)絡(luò)故障感知和告警、主動排障能力;在GPU自動化運(yùn)維插件方面,通過整合資源管理、硬件監(jiān)控和Kubernetes調(diào)度能力,實(shí)現(xiàn)秒級故障感知、分鐘級完成故障自愈動作,這又從運(yùn)維層面為客戶提供了便捷。其提供了創(chuàng)新性的三維方式展示網(wǎng)絡(luò)拓?fù)浼斑B接關(guān)系,使用戶能夠直觀感知帶寬利用率及網(wǎng)絡(luò)抖動或故障位置。
第三,當(dāng)解決了高性能網(wǎng)絡(luò)的穩(wěn)定性后,就是存儲能力的提升。針對模型訓(xùn)練對數(shù)據(jù)的高度依賴,金山云通過自研平臺,實(shí)現(xiàn)了比開放數(shù)據(jù)框架CCNet更高的語料清洗效率,并在存算分離場景中展現(xiàn)出顯著優(yōu)勢。針對生成式AI客戶對數(shù)據(jù)清洗的需求,金山云還整合星曜裸金屬服務(wù)器EPC、大數(shù)據(jù)平臺KMR和對象存儲KS3推出了針對該場景的數(shù)據(jù)清洗解決方案,滿足預(yù)訓(xùn)練數(shù)據(jù)集、微調(diào)數(shù)據(jù)集生成對于數(shù)據(jù)清洗的需求。
為了滿足客戶對更高帶寬兌付能力的需求,金山云開發(fā)了全閃存對象存儲KS3極速型,最高可提供1Tbps/PB的兌付帶寬,相較基于機(jī)械硬盤(HDD)的對象存儲性能提升了上百倍。當(dāng)數(shù)據(jù)清洗后便會存儲下來進(jìn)行訓(xùn)練,訓(xùn)練任務(wù)需要訪問NAS,就像一個個讀取文件夾中的文件。為此,金山云又開發(fā)了文件存儲網(wǎng)關(guān),架在對象存儲之上,提供非常高的帶寬兌付能力。
集群規(guī)模更大時,就會涉及checkpoint快速保存問題。一旦集群中有一個出現(xiàn)故障,整個作業(yè)任務(wù)就要暫停,基于上一次的checkpoint進(jìn)行恢復(fù)。但是由于寫入速度不夠,恢復(fù)時間更長,恢復(fù)的代價(jià)也就會更大。為了解決在處理大規(guī)模集群的checkpoint緩存問題,金山云研發(fā)了分布式checkpoint機(jī)制,通過并發(fā)處理,大幅提升了寫入速度,縮短了訓(xùn)練因故障中斷后的恢復(fù)時間,為客戶提供了更加高效、可靠的訓(xùn)練環(huán)境。
在平臺能力方面,金山云針對不同客戶需求,靈活調(diào)整服務(wù)策略。對于平臺能力相對薄弱的客戶,金山云搭建了瀚海平臺,這是一個針對大模型閉環(huán)的訓(xùn)練平臺,涵蓋了數(shù)據(jù)標(biāo)注、清洗、質(zhì)量評測到數(shù)據(jù)配方管理的全方位服務(wù),有效降低了客戶的使用門檻。
中立定位,護(hù)航大模型企業(yè)穩(wěn)健前行
在當(dāng)今百模大戰(zhàn)的環(huán)境下,金山云憑借其獨(dú)特的中立定位和技術(shù)優(yōu)勢,成為眾多企業(yè)信賴的合作伙伴。劉濤介紹了金山云的獨(dú)特優(yōu)勢。
首先,金山云作為一家中立的云服務(wù)商,其獨(dú)特定位使其能夠站在客戶的角度,提供更加客觀、專業(yè)且無偏見的建議與服務(wù)。這種中立性確保了金山云在為客戶提供解決方案時,不會因任何潛在的利益沖突而損害客戶的利益,從而贏得了客戶的信任與好評。
其次,金山云不僅是一家云服務(wù)提供商,更是一站式MaaS解決方案服務(wù)商。從IaaS層的資源供應(yīng),到PaaS平臺能力,再到上層的模型訓(xùn)練,金山云提供了全面的支持。這種一站式的服務(wù)模式極大地簡化了客戶在訓(xùn)練大模型過程中的復(fù)雜度,使他們能夠更加便捷、高效地完成模型的訓(xùn)練和推理,進(jìn)而提升業(yè)務(wù)效率與競爭力。
最后,金山云還深知企業(yè)在實(shí)際工程實(shí)施中可能遇到的各種挑戰(zhàn)。因此,除了提供基礎(chǔ)的云服務(wù)和MaaS解決方案外,金山云還為客戶提供專業(yè)的咨詢服務(wù)。無論是前期的規(guī)劃與設(shè)計(jì),還是模型調(diào)優(yōu)、落地實(shí)施等關(guān)鍵環(huán)節(jié),金山云都能憑借豐富的經(jīng)驗(yàn)和專業(yè)的技術(shù)團(tuán)隊(duì),為客戶提供量身定制的解決方案,確??蛻舻捻?xiàng)目能夠順利推進(jìn)并取得成功。
多維度服務(wù)構(gòu)建智算云,靈活應(yīng)對企業(yè)多樣需求
隨著數(shù)字化轉(zhuǎn)型的深入推進(jìn),越來越多的企業(yè)開始關(guān)注如何利用人工智能技術(shù)提升業(yè)務(wù)效率和競爭力。智算云作為提供算力服務(wù)的重要平臺,能夠?yàn)槠髽I(yè)提供定制化的算力解決方案,滿足其在人工智能研發(fā)、高性能計(jì)算等方面的需求。
劉濤指出,智算云的概念遠(yuǎn)超于單純的算力提供范疇,它實(shí)際上是一個涵蓋多維度的綜合體系。其中包括了機(jī)器的維護(hù)與監(jiān)控、網(wǎng)絡(luò)基礎(chǔ)設(shè)施的構(gòu)建、管理運(yùn)維的全方位支持,以及平臺硬件資源和網(wǎng)絡(luò)資源的精細(xì)調(diào)度。它還涉及上層的作業(yè)任務(wù)管理和推理任務(wù)管理等多個環(huán)節(jié),形成了一個緊密相連、高效協(xié)同的閉環(huán)。
劉濤進(jìn)一步強(qiáng)調(diào),智算云的形態(tài)并不局限于公有云領(lǐng)域。實(shí)際上,如自動駕駛汽車企業(yè),由于面臨嚴(yán)格的數(shù)據(jù)合規(guī)要求,因此需要擁有專屬的Region來確保數(shù)據(jù)的合規(guī)性與安全性。金山云正是基于這一洞察,提供公有云專區(qū)解決方案,這是一種創(chuàng)新的分布式云建設(shè)模式,能夠滿足客戶對數(shù)據(jù)安全和合規(guī)性的高要求。金山云與客戶私有云環(huán)境的身份驗(yàn)證系統(tǒng)進(jìn)行集成,實(shí)現(xiàn)了統(tǒng)一的管理界面和API支持,為客戶提供了便捷的使用體驗(yàn)。
除此之外,金山云還致力于提供私有云服務(wù),全面滿足企業(yè)在智算、網(wǎng)絡(luò)、存儲、推理框架以及訓(xùn)練任務(wù)等方面的多元化需求。而這一切,都無需企業(yè)自行承擔(dān)基座建設(shè)和運(yùn)維等繁瑣任務(wù)。金山云規(guī)劃并推出智算平臺,通過在公有云側(cè)建立賬戶、計(jì)量等管理功能,同時在企業(yè)私有環(huán)境中部署具體業(yè)務(wù),實(shí)現(xiàn)了公有云與私有云的無縫對接與高效協(xié)同。
在持續(xù)提升公有云計(jì)算能力方面,金山云同樣不遺余力。公司不僅推出了面向企業(yè)級的性能保障型云服務(wù)器X8,以滿足客戶對高性能的苛刻要求;公司還首發(fā)了基于英特爾®至強(qiáng)®6能效核處理器的第九代云服務(wù)器高效型SE9,在計(jì)算性能、內(nèi)存性能、網(wǎng)絡(luò)能力和存儲能力等方面,SE9均實(shí)現(xiàn)大幅提升,能夠以更加靈活、高效的方式滿足客戶的多樣化需求。與此同時,金山云還傾力打造了完備的智能計(jì)算集群,憑借強(qiáng)大的技術(shù)實(shí)力和豐富的行業(yè)經(jīng)驗(yàn),全面滿足客戶在智算場景下的各類需求。
相關(guān)文章
- 金山云Q2營收23.5億元 AI戰(zhàn)略激活業(yè)務(wù)增長新空間
- 金山云攜具身智能等多個AI創(chuàng)新解決方案亮相WAIC
- 金山云攜6大AI創(chuàng)新成果亮相WAIC
- 金山云正式發(fā)布金山政務(wù)AI一體機(jī) AI賦能政務(wù)數(shù)智化開啟新篇章
- 金山云Q1營收19.7億元 AI持續(xù)釋放業(yè)務(wù)增長新動能
- 金山云接入Xiaomi MiMo、Qwen3系列模型
- 金山云出席數(shù)字產(chǎn)業(yè)集群專業(yè)工作會議 以云為基助力政企數(shù)智化轉(zhuǎn)型
- 金山云Q4 AI收入同比增長近500% 人工智能收入占比處行業(yè)領(lǐng)先地位
- 支持平臺部署!金山云完成基于國產(chǎn)芯片的DeepSeek滿血版適配
- 金山云完成階躍星辰最新兩款開源多模態(tài)大模型適配
- 金山云支持DeepSeek-R1/V3
- 金山云全面升級智算服務(wù)體系 開啟AI 2.0時代云計(jì)算發(fā)展新紀(jì)元
- 受益智算服務(wù)需求激增 金山云再獲市場青睞
- 以技術(shù)創(chuàng)新為驅(qū)動,持中立姿態(tài),金山云助力大模型發(fā)展落地 原創(chuàng)
- GenAI新時代,金山云以大模型助力者打開增量空間
- 金山云KDX行業(yè)DaaS平臺全面升級 助力垂直行業(yè)數(shù)智化發(fā)展
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 低空賦能,跨越山河,大疆運(yùn)載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
- 中國移動將支持eSIM全系產(chǎn)品,釋放成長新動能
- 晟聯(lián)科:以高速互連接口IP方案賦能Scale-up 生態(tài)
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實(shí)現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案