精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

GenAI新時代,金山云以大模型助力者打開增量空間

2024-09-26 10:18:58AI云資訊13398

黃河發(fā)源于青藏高原巴顏喀拉山北麓,全長約 5464 公里,自西向東流經(jīng)9個省市自治區(qū),黃河所到之處,河水泛濫帶來無窮災(zāi)難,但也有例外就是寧夏,素有九曲黃河富寧夏的說法。

如今,以生成式AI為代表的人工智能技術(shù)來勢洶洶,誰能夠抓住機會,就能立于不敗之地。從最新第二季度財報顯示:金山云的人工智能業(yè)務(wù)表現(xiàn)亮眼,第二季度收入大幅增長至3.26億元,占公有云收入的26%,環(huán)比翻倍,在行業(yè)中處于領(lǐng)先地位,顯現(xiàn)出其在人工智能領(lǐng)域的潛力及對機遇的把握。數(shù)據(jù)顯示,金山云第二季度整體營收為18.9億元,較去年同期增長3.1%,環(huán)比增長6.5%。其中,公有云收入達12.3億元,同比增長6.5%,行業(yè)云收入為6.6億元。

金山云做對了什么?有哪些成功的技術(shù)策略?

為此,記者采訪了金山云高級副總裁劉濤,希望從中一探究竟。

金山云高級副總裁劉濤

“答案是圍繞智算云所進行的一系列產(chǎn)品升級和落地探索。” 劉濤開門見山地說。

劉濤表示:“作為一家深耕云賽道十余載的中立云服務(wù)商,金山云一直重視技術(shù)創(chuàng)新和客戶體驗,始終保持與前沿技術(shù)同頻,以契合多元化的客戶業(yè)務(wù)新需求?!?

這里的 “中立”非常重要。試想如果“金山系”、“雷系”也把大模型作為自己的賽道,即使你有強大的算力基礎(chǔ)設(shè)施和技術(shù)作為支撐,但戰(zhàn)略上競爭和沖突,一定會讓其他大模型廠家敬而遠之。

“中立”優(yōu)勢也收獲了客戶認可。目前專業(yè)大模型市場排前列的公司,大多都選擇了金山云。從規(guī)模上看,一個大型的算力集群,不僅是算力,更是對規(guī)模組網(wǎng)能力的考驗。

劉濤表示:高帶寬是被GenAI催生出來的需求,技術(shù)本身沒有那么成熟,其結(jié)果就會出現(xiàn)性能上的抖動。此外,多達上萬根的網(wǎng)絡(luò)布線在工程上也容易造成差錯,這些都是網(wǎng)絡(luò)層面必須要解決的工程難題。

“我們通過過去大概一年左右時間磨合,解決了大型集群能力的交付問題。我們自研的RoCE網(wǎng)絡(luò)監(jiān)控平臺提供集群端側(cè)和網(wǎng)側(cè)的基礎(chǔ)信息與指標、網(wǎng)絡(luò)故障感知和告警、主動排障能力;在GPU自動化運維插件方面,通過整合資源管理、硬件監(jiān)控和Kubernetes調(diào)度能力,實現(xiàn)秒級故障感知、分鐘級完成故障自愈動作?!眲f。

金山云另外一個優(yōu)勢:大數(shù)據(jù)集群的能力也發(fā)揮了作用。

針對大模型訓練中的CheckPoint快速保存問題,金山云提供了兩套方案:1.高性能全閃文件系統(tǒng)可提供高達500GB/s的并行寫入能力;2.并行文件網(wǎng)關(guān)加上全閃存儲對象組合的解決方案,提供數(shù)十GB/s的寫入能力。其中,前者用于模型訓練緩存,后者用于數(shù)據(jù)存儲。以Llama 70B訓練中的CheckPoint為例,金山云的CheckPoint寫入優(yōu)化方案可以實現(xiàn)訓練中斷時間小于15s。

劉濤強調(diào):專業(yè)大模型廠商往往會有都有自己的工程、任務(wù)調(diào)度、故障處理和文件原數(shù)的管理的平臺,但是對于一些偏重應(yīng)用類型的用戶,他們沒有那么強的管理和調(diào)度能力,以及CheckPoint的寫入優(yōu)化能力,也沒有故障自愈恢復(fù)能力,他們希望云廠商能夠提供一站式的服務(wù)。從數(shù)據(jù)的管理、清洗,到標注,金山云瀚海平臺能夠幫助用戶更好地處理和利用數(shù)據(jù),從而提高模型訓練效果。此外,為了幫助大模型應(yīng)用到業(yè)務(wù)場景,金山云瀚海平臺提供了豐富的工具和接口,并協(xié)助用戶進行業(yè)務(wù)系統(tǒng)的集成、模型的調(diào)優(yōu)和適配等問題。這涉及到數(shù)據(jù)配方管理、SFT(Supervised Fine-Tuning,有監(jiān)督微調(diào))等技術(shù),金山云有足夠經(jīng)驗和能力幫助到用戶。

同時,針對生成式AI客戶對數(shù)據(jù)清洗的需求,金山云還整合星曜裸金屬服務(wù)器EPC、大數(shù)據(jù)平臺KMR和對象存儲KS3推出了針對該場景的數(shù)據(jù)清洗解決方案,滿足預(yù)訓練數(shù)據(jù)集、微調(diào)數(shù)據(jù)集生成對于數(shù)據(jù)清洗的需求。

針對智駕等場景,金山云還提供公有云專區(qū)解決方案,這是一種創(chuàng)新的分布式云建設(shè)模式,能夠滿足客戶對數(shù)據(jù)安全和合規(guī)性的高要求。金山云與客戶私有云環(huán)境的身份驗證系統(tǒng)進行集成,實現(xiàn)了統(tǒng)一的管理界面和API支持,為客戶提供了便捷的使用體驗。

用劉濤的話說:你想要算力,我可以提供;你想訓模型,我可以輔助;工程上遇到問題,我可以做咨詢;涉及大模型落地,我可以幫你梳理需要解決的問題。從這個維度來看,金山云可以被稱為一站式MaaS解決方案服務(wù)商。

“在全球算力需求快速增長的當下,金山云將持續(xù)打磨核心技術(shù),攜手生態(tài)合作伙伴加速創(chuàng)新技術(shù)轉(zhuǎn)化,為行業(yè)和企業(yè)的高質(zhì)發(fā)展提供助力?!眲f。

前不久,金山云基于與英特爾長期緊密合作以及對其產(chǎn)品在業(yè)務(wù)表現(xiàn)上的信心,發(fā)布了基于英特爾®至強®6能效核處理器的第九代云服務(wù)器高效型SE9,在整機性能提升的同時,核心密度翻倍,充分釋放技術(shù)紅利。相較于線上主售機型,SE9單核性能提升30%,性價比提升超60%,最大套餐規(guī)格支持256核512G;在內(nèi)存性能上,SE9的單CPU支持8個DDR5內(nèi)存通道,頻率高達6400MT/s,非一致性內(nèi)存訪問效率更優(yōu);在網(wǎng)絡(luò)能力上,物理網(wǎng)絡(luò)支持至2x100G,能夠提供最高單虛機2400萬PPS,支持單虛機內(nèi)網(wǎng)吞吐最高可達100G,單虛機連接數(shù)最高可達400萬;在存儲能力上,搭載極速云盤ESSD,最高可支持單盤吞吐1GB/s、12萬IOPS,訪問時延低至0.2ms。

劉濤表示,GenAI將是一場深刻的革命,從大模型到自動駕駛、機器人應(yīng)用等很多領(lǐng)域,人工智能技術(shù)的加持,就像大腦一樣,為業(yè)務(wù)場景化注入了靈魂,勢必會帶來翻天覆地的變化。

雷軍說過:“站在風口,豬也能夠飛上天”。

這一次,卡位GenAI的賽道,金山云再一次證明了自己的眼光和實力,成績的取得,不過是水到渠成。

相關(guān)文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術(shù)

更多>>
AI云資訊(愛云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺。
合作QQ:1211461360微信號:icloudnews