專為AI推理而生的英偉達(dá)Tesla T4芯片
2018-09-22 12:00:16AI云資訊1227
圖:望潮科技測評
深度學(xué)習(xí)技術(shù)以及其他機(jī)器學(xué)習(xí)技術(shù)已經(jīng)大大提高了AI的聲音識別和圖片分類能力,并應(yīng)用在越來越多的領(lǐng)域。
但,現(xiàn)階段,深度學(xué)習(xí)技術(shù)更擅長做的是從大數(shù)據(jù)中找到線索,而不是理解這些數(shù)據(jù),并得出結(jié)論。就好像深度學(xué)習(xí)能夠識別出照片中的一只貓,但它不能“說出”貓的胡須、眼睛等具體信息,只能給出模棱兩可的答案,甚至有可能將印有小貓圖案的毛毯誤認(rèn)為一只貓。
也正因如此,隨著機(jī)器學(xué)習(xí)行業(yè)趨于平衡,芯片廠商的關(guān)注點(diǎn)越來越多的轉(zhuǎn)移到推理上。
作為全球三大芯片巨頭之一,推理對于英偉達(dá)而言,一點(diǎn)也不陌生。其第一款基于GPU的推理引擎是Tesla M4和Tesla M40,它們發(fā)布于2015年。
兩年前,英偉達(dá)推出專門針對機(jī)器學(xué)習(xí)推理的TeslaP4和P40加速器。兩年后,它的升級版來了。
功耗更低,速度更快的Tesla T4
近日,英偉達(dá)CEO黃仁勛在東京發(fā)布最新一代專用于機(jī)器學(xué)習(xí)和數(shù)據(jù)推理的CPU Tesla T4。同時,英偉達(dá)表示,谷歌將率先將新款T4 GPU推向其云平臺。

據(jù)悉,Tesla T4搭配TensorR T軟件組成的新平臺,主要面向AI應(yīng)用,包括智能語音、翻譯、視頻、圖像、推薦等應(yīng)用領(lǐng)域,號稱處理查詢的速度比僅采用CPU時快了40倍,同時延遲更低。

在運(yùn)算速度上,英偉達(dá)表示T4明顯快于P4。比如,在語音識別模型DeepSpeech 2上,T4比P4的5倍還要快;在神經(jīng)網(wǎng)絡(luò)翻譯模型GNMT上,T4的速度接近P4的4倍;在圖像識別模型ResNet-50上,T4也接近P4的3倍。
那T4快在哪里?
快在算力的增長。而決定T4算力增長的重中之重在于其圖靈架構(gòu)里的張量核心(Tensor Core)。T4內(nèi)置了320個張量核心,這就讓其數(shù)據(jù)吞吐量疾速增長,峰值達(dá)到260 TOPS(精度INT4) 。

然而,令人詫異的是,Tesla T4的功耗低的不可思議,整卡僅75W,無需輔助供電。而核心規(guī)模更小、計(jì)算性能更低的RTX 2070還要175-185W,顯然這塊卡在計(jì)算、功耗方面都做了特殊的優(yōu)化!當(dāng)然,也不能排除,這與RT光線追蹤的耗電程度有關(guān)。
外觀和內(nèi)存
外觀上,該卡采用了PCI-E擴(kuò)展卡樣式,全覆蓋金屬外殼,散熱器隱藏在內(nèi)部,整體極具質(zhì)感也相當(dāng)干練,同時因?yàn)槊嫦蛴?jì)算領(lǐng)域而沒有視頻輸出接口。

而在內(nèi)存方面,其搭配了16GB GDDR6,雙倍于游戲卡,不過帶寬僅320GB/s,因此要么降低了位寬,要么降低了頻率。
除了芯片以外,英偉達(dá)還將提供圍繞T4的一系列技術(shù),如用于優(yōu)化深度學(xué)習(xí)模型的 TensorRT 軟件,包括 TensorRT 推理服務(wù)器。TensorRT 是一個高度集成化的數(shù)據(jù)中心推理微服務(wù),可以無縫插入現(xiàn)有的 Kubernetes 設(shè)施中。
推理工作負(fù)載將成為芯片廠商爭奪的熱門市場
事實(shí)上,專注于提升推理工作負(fù)載的性能,也是英偉達(dá)的一項(xiàng)戰(zhàn)略舉措。
據(jù)公司預(yù)計(jì),未來五年,該市場將增長至200億美元。與此同時,英特爾也聲稱,世界上大多數(shù)的推理工作負(fù)載,仍將運(yùn)行在基于至強(qiáng)處理器的平臺上。
鑒于當(dāng)前英特爾占有全球約96%的服務(wù)器市場,這種說法還是相當(dāng)可信的。并且,最近,英特爾還宣布在2017年為AI工作負(fù)載銷售了10億美元的處理器。預(yù)計(jì)未來幾年,該數(shù)字還會迅速增長。
顯然,推理工作負(fù)載將成為英偉達(dá)、英特爾、AMD 多家爭奪的熱門市場。
在這個市場上,作為老牌巨頭,英特爾憑借的,是其在服務(wù)器市場的先發(fā)優(yōu)勢。而低成本、低功耗的推理加速器,如 Tesla T4,將對其發(fā)起每瓦特性能的巨大挑戰(zhàn)。
據(jù)悉,AMD 也即將推出用于深度學(xué)習(xí)的 7nmRadeon Instinct GPU,谷歌也在積極開發(fā)自研的定制芯片,如 TPU?;蛟S,在未來幾年,我們能見證該領(lǐng)域的最終獲勝者。
相關(guān)文章
- 億道數(shù)碼攜驍龍AI PC矩陣亮相高通科技日,定義移動辦公輕時代
- 直擊WAIC 2025 | 浩鯨科技聯(lián)合螞蟻數(shù)科發(fā)起“金融智能體應(yīng)用聯(lián)創(chuàng)聯(lián)盟”
- 多模態(tài)AI融入日常交互 用三星Galaxy手機(jī)搭建效率工作流
- 引領(lǐng)智能運(yùn)維!全新FortiAIOps 3.0重新定義IT運(yùn)營
- 得瑞領(lǐng)新閃耀2025全球閃存峰會:D8000系列斬獲創(chuàng)新大獎,強(qiáng)勢賦能AI時代數(shù)據(jù)基石
- WAIC 2025 | SHIXP將與PPIO共建分布式智算樞紐平臺
- 2025 WAIC落幕,深謀科技以技術(shù)與落地破局具身智能賽道
- AI賦能基層“智治” 湖北移動打造數(shù)字鄉(xiāng)村治理新樣本
- AI重磅獎項(xiàng)揭曉!用友大易榮膺人力資源服務(wù)業(yè)AI25強(qiáng)及思旗獎
- 中國最大黑客松AdventureX 2025杭州啟幕,涂鴉賦能青年開發(fā)者引爆Physical AI變革
- WAIC2025:澳鵬發(fā)布新一代技術(shù)平臺矩陣 助力大模型垂直應(yīng)用落地
- 共建AI PC企業(yè)服務(wù)生態(tài),京東政企業(yè)務(wù)攜手高通打造驍龍AI PC生態(tài)科技日
- 2025 WAIC“智算技術(shù)創(chuàng)新與行業(yè)實(shí)踐” 論壇圓滿落幕 共繪智算生態(tài)新藍(lán)圖
- 四維圖新亮相2025世界智能汽車大會:以AI新基建與數(shù)據(jù)閉環(huán)賦能智駕新范式
- 星辰聚智·才啟未來:2025世界人工智能大會中國電信發(fā)布系列前沿能力及AI產(chǎn)品
- 神州云動CRM亮相2025浪潮AI向新 數(shù)字企業(yè)創(chuàng)新大會
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 低空賦能,跨越山河,大疆運(yùn)載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
- 中國移動將支持eSIM全系產(chǎn)品,釋放成長新動能
- 晟聯(lián)科:以高速互連接口IP方案賦能Scale-up 生態(tài)
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實(shí)現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案