禁令解除72小時:141GB H20 跑滿血實測,DeepSeek 性能超預期
2025-07-18 11:20:27AI云資訊2975
2025 年 7 月 15 日,英偉達 CEO 黃仁勛宣布了一個震動 AI 圈的消息:美國政府即日起解除 H20 芯片對華銷售禁令,而就在禁令解除后,云工場科技發(fā)布詳細測試數(shù)據(jù)--- 8 卡 141GB 顯存的 H20 服務器,能流暢運行 671B 參數(shù)的滿血版非量化 DeepSeek-R1 模型,推理吞吐量突破預期。
硬核實測:141GB H20 跑滿血版非量化 DeepSeek 性能全面解析
測試環(huán)境配置
一. 測試數(shù)據(jù)
二. 關鍵性能測試結果
測試顯示:
1.首 token 響應快: 在測試的多個并發(fā)量下,首個 Token 的響應時間 (TTFT) 都保持在3秒以內(nèi)(實測 0.1s - 2.8s),用戶體驗非常流暢,感覺不到任何延遲。
2.高并發(fā)吞吐大: H20 顯卡展現(xiàn)出優(yōu)秀的并發(fā)處理能力。在模擬 100 個用戶同時提問(并發(fā)請求=100)的中高負載場景下:
·處理短問題(輸入/輸出各 256 tokens),系統(tǒng)總吞吐量高達 約 1124 tokens/s。
·處理典型問題(輸入/輸出各 1K tokens),總吞吐量穩(wěn)定在 約 1100 tokens/s。
·處理復雜問題/長對話(輸入/輸出各 2K tokens),總吞吐量仍能保持 約 1020 tokens/s。
分場景性能趨勢:
1.低并發(fā)場景 (<10 用戶):
·響應極快: TTFT 始終低于 0.9 秒,用戶幾乎感覺不到等待。
·吞吐未飽和: 系統(tǒng)能力遠未被充分利用,吞吐量相對較低(32-208 tokens/s),性能表現(xiàn)輕松自如。
2.中高并發(fā)場景 (50-100用戶):
·響應依然迅速: TTFT 保持在 1.9 秒 (1K上下文) 到 2.8 秒 (2K上下文),交互體驗依然流暢。
·吞吐大幅躍升: 系統(tǒng)資源得到高效利用,總吞吐量急劇上升至 634 - 1124 tokens/s。
·長上下文優(yōu)勢顯現(xiàn): 在相同并發(fā)下,處理更長(1K/2K)的上下文通常能獲得比短上下文(256)更高的吞吐量(尤其在并發(fā)50時最明顯),充分體現(xiàn)了 vLLM 對長文本的優(yōu)化效果。
3.極限場景 (100用戶 + 長上下文 2K):
·響應可控: TTFT 為 2.8 秒,交互體驗依然流暢。
·吞吐維持高位: 即使在此壓力下,系統(tǒng)總吞吐量仍達 1020 tokens/s。
三.測試總結
云工場科技構建了全面的異構計算資源池,涵蓋 NVIDIA 全系高性能 GPU(包括 141GB 顯存 H20、L20、RTX 4090 等最新型號)、AMD w7900 以及國產(chǎn)算力三巨頭(華為昇騰 910B 系列、百度昆侖芯 P800、燧原 S60)等等,可本地部署到就近機房,提供 DeepSeek、文心一言、華為盤古、LLaMA 等開源大模型本地部署。
通過嚴格的橫向性能基準測試,云工場科技驗證了不同架構 GPU 在 LLM 推理、計算機視覺等場景的能效比差異,并為客戶提供"算力租賃 + 算力智能調度 + 平臺化交付"的完整 AI 服務體系,目前已在教育/工業(yè)/通信/交通等多領域成功落地,支撐其大模型部署、推理及場景化落地的全流程需求。
相關文章
- 如何查找全國新建工程項目信息?RCC瑞達恒接入DEEPSEEK,推出AI助手
- DeepSeek-R2要來了?速領450元代金券,模型測評快人一步!
- 禁令解除72小時:141GB H20 跑滿血實測,DeepSeek 性能超預期
- 工學通與 DeepSeek:AI 領域的專業(yè)細分與通用探索
- 百度AI搜索全面接入DeepSeek R1 最新版 進一步強化智能搜索體驗
- 青云科技AI算力云大模型服務上線 DeepSeek-R1-0528
- AI營響力:DeepSeek和智能體寫短視頻腳本,有什么不同?
- 北大楊仝團隊發(fā)布FairyR1模型:5%參數(shù)量數(shù)學和代碼能力超越滿血DeepSeek
- 中文大模型幻覺測評:豆包大模型準確率全球第一,超越DeepSeek-R1、Gemini-2.5、GPT-4o
- 騰訊云智算全新升級,相關技術能力剛獲DeepSeek公開點贊
- 易聯(lián)眾醫(yī)信助力泉州市中醫(yī)院DeepSeek項目入選泉州十佳數(shù)字賦能案例
- DeepSeek+物流行業(yè),AI大模型破解五大場景效能困局
- IBM專家觀點:假如DeepSeek們使用了IBM AI存儲
- 從會議記錄到戰(zhàn)略智庫:訊飛聽見AI紀要—DeepSeek模式上線!
- 智能協(xié)作新紀元,華天動力協(xié)同OA系統(tǒng)的HR管理平臺深度融合 DeepSeek的四大應用場景
- 聯(lián)想官方零售發(fā)力AI普惠!來酷科技推出DeepSeek本地部署服務
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球對話
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案