金山云支持DeepSeek-R1/V3
2025-02-10 11:29:29AI云資訊25851
金山云在公有云場景和國資云/政務(wù)云場景已支持DeepSeek-R1/V3。
場景一 公有云場景針對DeepSeek-R1蒸餾模型的多種鏡像服務(wù)
金山云已正式發(fā)布基于DeepSeek-R1蒸餾模型的多種鏡像服務(wù),用戶可以在金山云官網(wǎng),進(jìn)入“金山云控制臺”免費體驗。
通過金山云發(fā)布的DeepSeek鏡像服務(wù),用戶可在公有云GPU云服務(wù)器、GPU裸金屬服務(wù)器分別搭建推理服務(wù)并進(jìn)行調(diào)參驗證。
云服務(wù)器鏡像獲取方式
在云服務(wù)器控制臺按需選擇實例規(guī)格后,在“鏡像配置-鏡像市場-工具軟件”模塊選擇DeepSeek-R1系列的鏡像創(chuàng)建云服務(wù)器,登錄實例進(jìn)行部署驗證。
鏡像內(nèi)置DeepSeek模型的使用方法
vLLM 部署提供支持,適用于高性能大語言模型的推理和微調(diào)任務(wù),支持DeepSeek系列模型運(yùn)行。DeepSeek模型部署推薦的實例規(guī)格配置以及詳細(xì)驗證方法,可參考金山云官網(wǎng)文檔內(nèi)置DeepSeek模型的使用方法:https://docs.ksyun.com/documents/44126?type=3
裸金屬鏡像獲取方式
當(dāng)前,金山云裸金屬GPU系列機(jī)型均能高效支持DeepSeek-R1蒸餾模型快速部署,部分機(jī)型可支持DeepSeek-R1滿血版671B模型的快捷使用。針對DeepSeek蒸餾模型提供自定義鏡像,開機(jī)即用,滿血版模型可通過KS3快速下載部署使用。
在裸金屬服務(wù)器的實例規(guī)格選擇界面選擇合適的機(jī)型后,進(jìn)入“選擇鏡像”步驟,選取DeepSeek-R1系列鏡像創(chuàng)建裸金屬服務(wù)器實例。實例創(chuàng)建并成功啟動后即可通過遠(yuǎn)程連接工具登錄到該實例驗證并使用。
金山云針對DeepSeek-R1蒸餾模型鏡像服務(wù)的適用場景及特點
適用場景:
長文檔分析、多輪對話、復(fù)雜代碼項目理解等。
特點:
針對長上下文場景優(yōu)化,支持 32K tokens 窗口。
使用 Positional Interpolation(位置插值)技術(shù)降低長文本推理的復(fù)雜度。
提供較小尺寸的 DeepSeek 蒸餾版本模型適用于基礎(chǔ)公有云、中小型企業(yè)內(nèi)部實時部署,也方便個人用戶快速搭建對話服務(wù)。
*云服務(wù)器本次開放1.5B、32B兩種尺寸模型鏡像,其余尺寸模型鏡像陸續(xù)更新中。金山云公有云自研平臺推理部署模塊即將接入DeepSeek,更多國產(chǎn)芯片適配工作也在加速推進(jìn)中。
場景二 金山云國資云/政務(wù)云場景全面支持DeepSeek-R1/V3推理服務(wù)
金山云國資云/政務(wù)云平臺已正式上架 DeepSeek-R1和 DeepSeek-V3模型。通過集成金山云自研的內(nèi)容安全服務(wù),客戶可實現(xiàn)模型安全增強(qiáng)與企業(yè)級高可用保障。
金山云國資云/政務(wù)云平臺具備優(yōu)異的模型推理托管能力,支持vLLM、LMDeploy、TensorRT-LLM、SGLang等各類主流推理框架,可實現(xiàn)模型的自定義導(dǎo)入與部署,為開發(fā)者提供了高度靈活的開發(fā)環(huán)境。目前,金山云的人工智能技術(shù)已被多個央國企采納,顯著提升了其數(shù)據(jù)處理效率。
依托國資云/政務(wù)云平臺,金山云通過模型市場構(gòu)建豐富的模型資源,同時匹配包含數(shù)據(jù)加工、模型精調(diào)、模型評估、模型量化等關(guān)鍵環(huán)節(jié)在內(nèi)的一站式模型工具鏈,始終致力于為用戶提供全流程、一站式的AI服務(wù),助力客戶在實際業(yè)務(wù)場景中深度優(yōu)化模型性能。
在人工智能浪潮下,金山云將繼續(xù)堅持技術(shù)立業(yè),加速技術(shù)創(chuàng)新落地,攜手生態(tài)企業(yè)積極擁抱時代機(jī)遇,助力行業(yè)數(shù)智化轉(zhuǎn)型。
相關(guān)文章
- 金山云Q2營收23.5億元 AI戰(zhàn)略激活業(yè)務(wù)增長新空間
- 金山云攜具身智能等多個AI創(chuàng)新解決方案亮相WAIC
- 金山云攜6大AI創(chuàng)新成果亮相WAIC
- 金山云正式發(fā)布金山政務(wù)AI一體機(jī) AI賦能政務(wù)數(shù)智化開啟新篇章
- 金山云Q1營收19.7億元 AI持續(xù)釋放業(yè)務(wù)增長新動能
- 金山云接入Xiaomi MiMo、Qwen3系列模型
- 金山云出席數(shù)字產(chǎn)業(yè)集群專業(yè)工作會議 以云為基助力政企數(shù)智化轉(zhuǎn)型
- 金山云Q4 AI收入同比增長近500% 人工智能收入占比處行業(yè)領(lǐng)先地位
- 支持平臺部署!金山云完成基于國產(chǎn)芯片的DeepSeek滿血版適配
- 金山云完成階躍星辰最新兩款開源多模態(tài)大模型適配
- 金山云支持DeepSeek-R1/V3
- 金山云全面升級智算服務(wù)體系 開啟AI 2.0時代云計算發(fā)展新紀(jì)元
- 受益智算服務(wù)需求激增 金山云再獲市場青睞
- 以技術(shù)創(chuàng)新為驅(qū)動,持中立姿態(tài),金山云助力大模型發(fā)展落地 原創(chuàng)
- GenAI新時代,金山云以大模型助力者打開增量空間
- 金山云KDX行業(yè)DaaS平臺全面升級 助力垂直行業(yè)數(shù)智化發(fā)展
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 低空賦能,跨越山河,大疆運(yùn)載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
- 中國移動將支持eSIM全系產(chǎn)品,釋放成長新動能
- 晟聯(lián)科:以高速互連接口IP方案賦能Scale-up 生態(tài)
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案