GenAI新時代,金山云以大模型助力者打開增量空間
2024-09-26 10:18:58AI云資訊13398
黃河發(fā)源于青藏高原巴顏喀拉山北麓,全長約 5464 公里,自西向東流經(jīng)9個省市自治區(qū),黃河所到之處,河水泛濫帶來無窮災(zāi)難,但也有例外就是寧夏,素有九曲黃河富寧夏的說法。
如今,以生成式AI為代表的人工智能技術(shù)來勢洶洶,誰能夠抓住機會,就能立于不敗之地。從最新第二季度財報顯示:金山云的人工智能業(yè)務(wù)表現(xiàn)亮眼,第二季度收入大幅增長至3.26億元,占公有云收入的26%,環(huán)比翻倍,在行業(yè)中處于領(lǐng)先地位,顯現(xiàn)出其在人工智能領(lǐng)域的潛力及對機遇的把握。數(shù)據(jù)顯示,金山云第二季度整體營收為18.9億元,較去年同期增長3.1%,環(huán)比增長6.5%。其中,公有云收入達12.3億元,同比增長6.5%,行業(yè)云收入為6.6億元。
金山云做對了什么?有哪些成功的技術(shù)策略?
為此,記者采訪了金山云高級副總裁劉濤,希望從中一探究竟。
金山云高級副總裁劉濤
“答案是圍繞智算云所進行的一系列產(chǎn)品升級和落地探索。” 劉濤開門見山地說。
劉濤表示:“作為一家深耕云賽道十余載的中立云服務(wù)商,金山云一直重視技術(shù)創(chuàng)新和客戶體驗,始終保持與前沿技術(shù)同頻,以契合多元化的客戶業(yè)務(wù)新需求?!?
這里的 “中立”非常重要。試想如果“金山系”、“雷系”也把大模型作為自己的賽道,即使你有強大的算力基礎(chǔ)設(shè)施和技術(shù)作為支撐,但戰(zhàn)略上競爭和沖突,一定會讓其他大模型廠家敬而遠之。
“中立”優(yōu)勢也收獲了客戶認可。目前專業(yè)大模型市場排前列的公司,大多都選擇了金山云。從規(guī)模上看,一個大型的算力集群,不僅是算力,更是對規(guī)模組網(wǎng)能力的考驗。
劉濤表示:高帶寬是被GenAI催生出來的需求,技術(shù)本身沒有那么成熟,其結(jié)果就會出現(xiàn)性能上的抖動。此外,多達上萬根的網(wǎng)絡(luò)布線在工程上也容易造成差錯,這些都是網(wǎng)絡(luò)層面必須要解決的工程難題。
“我們通過過去大概一年左右時間磨合,解決了大型集群能力的交付問題。我們自研的RoCE網(wǎng)絡(luò)監(jiān)控平臺提供集群端側(cè)和網(wǎng)側(cè)的基礎(chǔ)信息與指標、網(wǎng)絡(luò)故障感知和告警、主動排障能力;在GPU自動化運維插件方面,通過整合資源管理、硬件監(jiān)控和Kubernetes調(diào)度能力,實現(xiàn)秒級故障感知、分鐘級完成故障自愈動作?!眲f。
金山云另外一個優(yōu)勢:大數(shù)據(jù)集群的能力也發(fā)揮了作用。
針對大模型訓練中的CheckPoint快速保存問題,金山云提供了兩套方案:1.高性能全閃文件系統(tǒng)可提供高達500GB/s的并行寫入能力;2.并行文件網(wǎng)關(guān)加上全閃存儲對象組合的解決方案,提供數(shù)十GB/s的寫入能力。其中,前者用于模型訓練緩存,后者用于數(shù)據(jù)存儲。以Llama 70B訓練中的CheckPoint為例,金山云的CheckPoint寫入優(yōu)化方案可以實現(xiàn)訓練中斷時間小于15s。
劉濤強調(diào):專業(yè)大模型廠商往往會有都有自己的工程、任務(wù)調(diào)度、故障處理和文件原數(shù)的管理的平臺,但是對于一些偏重應(yīng)用類型的用戶,他們沒有那么強的管理和調(diào)度能力,以及CheckPoint的寫入優(yōu)化能力,也沒有故障自愈恢復(fù)能力,他們希望云廠商能夠提供一站式的服務(wù)。從數(shù)據(jù)的管理、清洗,到標注,金山云瀚海平臺能夠幫助用戶更好地處理和利用數(shù)據(jù),從而提高模型訓練效果。此外,為了幫助大模型應(yīng)用到業(yè)務(wù)場景,金山云瀚海平臺提供了豐富的工具和接口,并協(xié)助用戶進行業(yè)務(wù)系統(tǒng)的集成、模型的調(diào)優(yōu)和適配等問題。這涉及到數(shù)據(jù)配方管理、SFT(Supervised Fine-Tuning,有監(jiān)督微調(diào))等技術(shù),金山云有足夠經(jīng)驗和能力幫助到用戶。
同時,針對生成式AI客戶對數(shù)據(jù)清洗的需求,金山云還整合星曜裸金屬服務(wù)器EPC、大數(shù)據(jù)平臺KMR和對象存儲KS3推出了針對該場景的數(shù)據(jù)清洗解決方案,滿足預(yù)訓練數(shù)據(jù)集、微調(diào)數(shù)據(jù)集生成對于數(shù)據(jù)清洗的需求。
針對智駕等場景,金山云還提供公有云專區(qū)解決方案,這是一種創(chuàng)新的分布式云建設(shè)模式,能夠滿足客戶對數(shù)據(jù)安全和合規(guī)性的高要求。金山云與客戶私有云環(huán)境的身份驗證系統(tǒng)進行集成,實現(xiàn)了統(tǒng)一的管理界面和API支持,為客戶提供了便捷的使用體驗。
用劉濤的話說:你想要算力,我可以提供;你想訓模型,我可以輔助;工程上遇到問題,我可以做咨詢;涉及大模型落地,我可以幫你梳理需要解決的問題。從這個維度來看,金山云可以被稱為一站式MaaS解決方案服務(wù)商。
“在全球算力需求快速增長的當下,金山云將持續(xù)打磨核心技術(shù),攜手生態(tài)合作伙伴加速創(chuàng)新技術(shù)轉(zhuǎn)化,為行業(yè)和企業(yè)的高質(zhì)發(fā)展提供助力?!眲f。
前不久,金山云基于與英特爾長期緊密合作以及對其產(chǎn)品在業(yè)務(wù)表現(xiàn)上的信心,發(fā)布了基于英特爾®至強®6能效核處理器的第九代云服務(wù)器高效型SE9,在整機性能提升的同時,核心密度翻倍,充分釋放技術(shù)紅利。相較于線上主售機型,SE9單核性能提升30%,性價比提升超60%,最大套餐規(guī)格支持256核512G;在內(nèi)存性能上,SE9的單CPU支持8個DDR5內(nèi)存通道,頻率高達6400MT/s,非一致性內(nèi)存訪問效率更優(yōu);在網(wǎng)絡(luò)能力上,物理網(wǎng)絡(luò)支持至2x100G,能夠提供最高單虛機2400萬PPS,支持單虛機內(nèi)網(wǎng)吞吐最高可達100G,單虛機連接數(shù)最高可達400萬;在存儲能力上,搭載極速云盤ESSD,最高可支持單盤吞吐1GB/s、12萬IOPS,訪問時延低至0.2ms。
劉濤表示,GenAI將是一場深刻的革命,從大模型到自動駕駛、機器人應(yīng)用等很多領(lǐng)域,人工智能技術(shù)的加持,就像大腦一樣,為業(yè)務(wù)場景化注入了靈魂,勢必會帶來翻天覆地的變化。
雷軍說過:“站在風口,豬也能夠飛上天”。
這一次,卡位GenAI的賽道,金山云再一次證明了自己的眼光和實力,成績的取得,不過是水到渠成。
相關(guān)文章
- 金山云Q2營收23.5億元 AI戰(zhàn)略激活業(yè)務(wù)增長新空間
- 金山云攜具身智能等多個AI創(chuàng)新解決方案亮相WAIC
- 金山云攜6大AI創(chuàng)新成果亮相WAIC
- 金山云正式發(fā)布金山政務(wù)AI一體機 AI賦能政務(wù)數(shù)智化開啟新篇章
- 金山云Q1營收19.7億元 AI持續(xù)釋放業(yè)務(wù)增長新動能
- 金山云接入Xiaomi MiMo、Qwen3系列模型
- 金山云出席數(shù)字產(chǎn)業(yè)集群專業(yè)工作會議 以云為基助力政企數(shù)智化轉(zhuǎn)型
- 金山云Q4 AI收入同比增長近500% 人工智能收入占比處行業(yè)領(lǐng)先地位
- 支持平臺部署!金山云完成基于國產(chǎn)芯片的DeepSeek滿血版適配
- 金山云完成階躍星辰最新兩款開源多模態(tài)大模型適配
- 金山云支持DeepSeek-R1/V3
- 金山云全面升級智算服務(wù)體系 開啟AI 2.0時代云計算發(fā)展新紀元
- 受益智算服務(wù)需求激增 金山云再獲市場青睞
- 以技術(shù)創(chuàng)新為驅(qū)動,持中立姿態(tài),金山云助力大模型發(fā)展落地 原創(chuàng)
- GenAI新時代,金山云以大模型助力者打開增量空間
- 金山云KDX行業(yè)DaaS平臺全面升級 助力垂直行業(yè)數(shù)智化發(fā)展
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
- 中國移動將支持eSIM全系產(chǎn)品,釋放成長新動能
- 晟聯(lián)科:以高速互連接口IP方案賦能Scale-up 生態(tài)
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案