術業(yè)有專攻——AI系統(tǒng)主控CPU英特爾至強6新品處理器淺析
2025-06-19 17:02:34AI云資訊1463
一、至強6與NVIDIA GPU協(xié)同的硬件基礎
在 AI 異構計算架構中,英特爾至強6處理器作為主控CPU可以與NVIDIA最新GPU 很好地協(xié)同。根據英偉達官網信息,目前其DGX B300系統(tǒng)選擇至強6776P作為唯一主控CPU,采用雙路配置,通過UPI總線實現(xiàn)CPU間互連。這8個GPU通過NVLink高速互連,是性能比較高端的DGX,為訓練等應用而設計。
作為主控CPU,它和GPU協(xié)同工作,而這個系統(tǒng)的性能受到諸多因素的影響,這里列出的是最主要的因素,包括I/O、核心性能、內存(包括帶寬和容量)、CPU上的預處理或卸載(offload)能力、整體CPU系統(tǒng)的RAS,以及各種硬件的外形設計等。這些都會影響整個AI系統(tǒng)的端到端性能,因此AI系統(tǒng)通常比較復雜。
這一設計的性能提升要點在于:
1.業(yè)界領先的I/O通道和內存能力
AP平臺的雙路至強6最多可以提供192條PCIe 5.0通道,也就是可以每路提供96條通道,相比上一代提升20%,內存通道也可以高達12個。直接匹配多GPU的高速接入需求,避免因通道不足導致的帶寬瓶頸。
在SP平臺上,英特爾還提供了一個差異化的產品,就是在單個CPU插槽上提供了更豐富的I/O資源(Rich I/O one socket),總共有136根的PCIe通道,持單插槽連接多塊加速卡與存儲設備,適用于邊緣端“預處理+推理”一體化場景。同時,其高帶寬內存可容納更大模型參數,提升訓練效率。在推理場景中,靈活的核心配置確保資源高效利用,滿足多樣化需求。
2.核心性能優(yōu)化
至強6區(qū)別于上一代產品的關鍵技術突破是Priority Core Turbo(PCT),其技術本質是通過 Speed Select(SST)將單路CPU核心劃分為兩組:最多8個高頻核心(PCT 核心)與剩余低頻核心。在DGX B300場景中,這一技術直接服務于 “CPU 驅動 GPU” 的典型需求,實現(xiàn)高頻核心的精準調度:當 GPU 需要快速獲取預處理數據(如從內存讀取原始數據并完成清洗、特征工程)時,8個PCT核心可睿頻至4.6GHz(傳統(tǒng)64核SKU最大睿頻為3.9GHz),相比全核睿頻(3.6GHz)提升28%。這一特性縮短了數據從CPU到GPU的傳輸延遲。
3.資源分配的靈活性
PCT核心數量可通過BIOS或 SST-TF工具動態(tài)配置,客戶可根據實際負載調整——客戶在使用時可以根據需要選擇8個、6個、4個或2個PCT核心。例如推理場景中若僅需4塊GPU工作,可配置4個PCT 核心對應驅動,避免資源浪費。與上一代 Max Turbo 技術的差異在于:PCT允許全核在線(無需半數核心休眠),且維持相同 TDP(350W)與散熱設計,確保硬件兼容性,降低客戶部署成本。
4.更強的內存架構兼容性
更高的內存帶寬對于AI工作負載至關重要,因為AI的工作流程是一個完整的數據處理管道,而非單一環(huán)節(jié)。在這一過程中,CPU首先負責預處理,從內存中讀取數據并進行初步處理,隨后將數據傳輸至GPU。比如,至強6支持8通道到12通道的DDR5-6400內存,還支持MRDIMMs,能提供更高的30%帶寬。
在LLM的生成式推理(如文本續(xù)寫)中,自注意力機制需為每個已處理的Token生成并存儲鍵(Key)和值(Value)矩陣,即KV Cache。KV Cache避免了在解碼階段重復計算歷史Token的注意力狀態(tài),但會隨序列長度線性增長,占用大量GPU顯存,需要卸載到下一級存儲中。對于CXL內存來說,有一個典型用例是KV Cache的卸載,通過用CXL內存去替代SSD,這樣KV Cache的訪問速度顯著增快,從而提升了性能。
5.RAS和數據預處理
在企業(yè)級 AI 訓練場景中,系統(tǒng)可靠性直接影響算力利用率與TCO。至強6的RAS 體系覆蓋全硬件鏈路,可以通過RAS特性來可以提高I/O的穩(wěn)定性、內存系統(tǒng)穩(wěn)定性、UPI鏈路穩(wěn)定性、CPU及平臺穩(wěn)定性。CPU卸載則是針對MoE(混合專家)模型的另一種優(yōu)化方式。目前市場上已有諸多關于通過AMX矩陣技術將部分MoE模型中的專家層卸載至至強處理器的案例。
二、為何是至強6776P?
NVIDIA DGX B300選擇的雙路至強 6776P 的核心價值在于業(yè)界領先的I/O能力、領先的內存帶寬、大內存容量、領先的RAS能力已經為特定AI負載優(yōu)化的PCT產品。
其4.6GHz的睿頻能力顯著加速數據處理,PCT核心以4.6GHz頻率加速數據預處理(如文本分詞、圖像解碼),通過高速 PCIe 通道將數據傳輸至GPU,形成 “CPU 預處理→GPU 計算”的流水線作業(yè)。這款處理器擁有單路88條PCIe通道,雙路則達到176條。
英偉達選擇了2 DPC架構(每顆CPU提供8通道內存,每通道2個DIMM)進行配置,雙路系統(tǒng)可搭載32根DIMM,內存最大容量達8TB。
綜述:開放生態(tài)的實際意義
至強6的核心優(yōu)勢在于開放性與兼容性。客戶硬件選擇自由,可以根據成本動態(tài)切換,避免被單一供應商鎖定。在軟件生態(tài)兼容層面,至強6也完全支持主流 AI 框架(如 TensorFlow、PyTorch)與云原生技術,無需重新開發(fā)適配層,降低技術遷移成本。
從英偉達的選擇邏輯看,DGX B300 采用至強6應該并非單一性能導向,而是綜合考量了生態(tài)開放性、成本可控性與技術成熟度 —— 至強 6 作為量產級產品,其穩(wěn)定性與供應鏈可靠性已通過大規(guī)模數據中心驗證。
至強6在搭配NVIDIA GPU場景中的價值,本質上源于其對“CPU 角色”的清晰定位:核心數量或睿頻頻率,都是圍繞 GPU 協(xié)同需求而定,根據用戶的不同需求,也可以選擇不同的CPU型號。在關鍵路徑(如高頻數據傳輸、大內存容量、系統(tǒng)穩(wěn)定性)上,至強6可以實現(xiàn)精準優(yōu)化。對于企業(yè)客戶而言,這意味著在 AI 基礎設施建設中,可通過標準化硬件獲取可預期的性能提升,同時避免為冗余功能支付額外成本。這種 “需求導向型” 技術路線,或許正是其成為英偉達首選主控 CPU 的核心原因。
相關文章
- 英特爾中國區(qū)董事長王銳將于本月榮休
- 下一個爆款在哪兒 2025英特爾人工智能創(chuàng)新應用大賽獲獎名單揭曉
- 官宣:美國政府89億美元入股英特爾,持股比例9.9%
- 投行稱英特爾想要成功轉型仍面臨漫長征程
- 聚焦液冷痛點:英特爾UQD互換性認證助力數據中心高效發(fā)展
- 軟銀投資20億美元入股英特爾,布局美國半導體制造擴張戰(zhàn)略
- 英特爾公開演示18A制程已適配非x86架構SoC芯片,開辟全新市場前景
- 英特爾AI PC應用新突破!三大應用重磅上線
- 英特爾的務實轉向:從技術導向到客戶共振
- 英特爾至強6助力阿里云第九代企業(yè)級ECS實例100天贏得超萬家客戶青睞
- 英特爾CEO陳立武:朝著正確方向砥礪前行
- 英特爾CEO陳立武的轉型計劃未能打動銀行業(yè)巨頭摩根大通
- 英特爾今年將裁員2.4萬人 并撤出德國、波蘭和哥斯達黎加市場
- 機械革命首批AI高靜游戲本亮相Bilibili World 2025,同英特爾奔赴高能澎湃下一局
- RealSense從英特爾分拆,融資5千萬美元加速機器人及生物識別AI視覺技術
- 英特爾攜手雷神共推AI高靜游戲本概念,ZERO 16 Pro帶來全能游戲體驗
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球對話
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產業(yè)鏈展主題發(fā)布
- 北京數基建發(fā)布“知行IntAct”混合智能體產品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數據價值化重構醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉型“最優(yōu)解”
- 腦神經成像提速數倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數據處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數據湖落地深勢科技,提升科研數據處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案