燧原科技亮相Hot Chips大會(huì),詳解邃思芯片架構(gòu)
2021-08-25 11:26:54AI云資訊1415
燧原科技第一代通用人工智能訓(xùn)練芯片“邃思1.0”封裝示意圖
邃思1.0是燧原科技2019年12月發(fā)布的第一代云端AI訓(xùn)練芯片,采用眾核結(jié)構(gòu),其計(jì)算核心采用了燧原科技自研的GCU-CARE計(jì)算引擎。整個(gè)SOC擁有32個(gè)GCU-CARE計(jì)算引擎,組成4個(gè)計(jì)算群組,全面支持常見AI張量數(shù)據(jù)格式(FP32/FP16/BF16, INT8/INT16/INT32),更全面地支撐客戶業(yè)務(wù)。CARE還創(chuàng)新地通過復(fù)用張量核心,用更有效的晶體管效率提供了標(biāo)量、向量、張量以及多種數(shù)據(jù)精度的計(jì)算能力。
GCU-DARE數(shù)據(jù)架構(gòu),面向數(shù)據(jù)流優(yōu)化,在數(shù)據(jù)流動(dòng)中進(jìn)行處理。512GB/s的HBM和200GB/s的GCU-LARE互聯(lián),數(shù)倍于傳統(tǒng)GPU、CPU;強(qiáng)勁的分布式片上共享緩存,提供10TB/s的超大帶寬;可編程共享緩存,可控線程內(nèi)、線程間數(shù)據(jù)常駐共享,消除不必要的IO訪問,既降低了數(shù)據(jù)訪問延時(shí),又節(jié)約了寶貴的IO帶寬;同時(shí),DARE架構(gòu)還提供數(shù)據(jù)異步加載接口,支持?jǐn)?shù)據(jù)與運(yùn)算的流水執(zhí)行,提高運(yùn)算并行度。
四路GCU-LARE智能互聯(lián),200GB/s的高速低延時(shí)片間互聯(lián)接口,靈活支持不同規(guī)模的計(jì)算需求,可支持千卡級(jí)規(guī)模集群,為大中小型數(shù)據(jù)中心提供基于不同需求的人工智能訓(xùn)練產(chǎn)品組合。
“邃思1.0”SOC
邃思1.0人工智能加速芯片專為云端訓(xùn)練場(chǎng)景設(shè)計(jì),支持CNN、RNN、LSTM、BERT等常用人工訓(xùn)練模型,可用于圖像、流數(shù)據(jù)、語(yǔ)音等訓(xùn)練場(chǎng)景。采用標(biāo)準(zhǔn)PCIe 4.0接口,廣泛兼容主流AI服務(wù)器,可滿足數(shù)據(jù)中心大規(guī)模部署的需求,且能效比領(lǐng)先。
演講的最后部分,劉彥還介紹了上個(gè)月剛剛在世界人工智能大會(huì)上發(fā)布的“邃思2.0”訓(xùn)練芯片。經(jīng)過全新升級(jí)迭代后,邃思2.0的計(jì)算能力、存儲(chǔ)和帶寬、互聯(lián)能力較第一代訓(xùn)練產(chǎn)品有巨大提升,對(duì)超大規(guī)模的模型支持能力獲得顯著增強(qiáng)。由此,燧原科技成為國(guó)內(nèi)首家發(fā)布第二代人工智能訓(xùn)練產(chǎn)品組合的公司。
邃思2.0進(jìn)行了大規(guī)模的架構(gòu)升級(jí),針對(duì)人工智能計(jì)算的特性進(jìn)行深度優(yōu)化,夯實(shí)了支持通用異構(gòu)計(jì)算的基礎(chǔ);支持全面的計(jì)算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,單精度FP32峰值算力達(dá)到40 TFLOPS,單精度張量TF32峰值算力達(dá)到160 TFLOPS。同時(shí)搭載了4顆HBM2E片上存儲(chǔ)芯片,高配支持64 GB內(nèi)存,帶寬達(dá)1.8 TB/s。GCU-LARE也全面升級(jí),提供雙向300 GB/s互聯(lián)帶寬,支持?jǐn)?shù)千張?jiān)旗軨loudBlazer加速卡互聯(lián),實(shí)現(xiàn)優(yōu)異的線性加速比。
燧原科技第二代通用人工智能訓(xùn)練芯片“邃思2.0”
而同步升級(jí)的馭算TopsRider軟件平臺(tái),成為燧原科技構(gòu)建原始創(chuàng)新軟件生態(tài)的基石。通過軟硬件協(xié)同架構(gòu)設(shè)計(jì),充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運(yùn)行提供解決方案。開放升級(jí)的編程模型和可擴(kuò)展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
關(guān)于燧原科技
燧原科技專注人工智能領(lǐng)域云端算力平臺(tái),致力為人工智能產(chǎn)業(yè)發(fā)展提供普惠的基礎(chǔ)設(shè)施解決方案,提供自主知識(shí)產(chǎn)權(quán)的高算力、高能效比、可編程的通用人工智能訓(xùn)練和推理產(chǎn)品。其創(chuàng)新性架構(gòu)、互聯(lián)方案和分布式計(jì)算及編程平臺(tái),可廣泛應(yīng)用于云數(shù)據(jù)中心、超算中心、互聯(lián)網(wǎng)、金融及政務(wù)等多個(gè)人工智能場(chǎng)景。
燧原科技攜手業(yè)內(nèi)國(guó)際標(biāo)準(zhǔn)組織,秉承開源開放的宗旨,與產(chǎn)業(yè)伙伴一起促進(jìn)人工智能產(chǎn)業(yè)發(fā)展。
相關(guān)文章
- 英偉達(dá)發(fā)布人形機(jī)器人芯片Jetson Thor,實(shí)現(xiàn)物理AI領(lǐng)域重大突破
- 蘋果首款折疊屏iPhone配四攝像頭和自研C2基帶芯片,并在設(shè)計(jì)上進(jìn)行重大創(chuàng)新
- 《2025存力發(fā)展報(bào)告》:我國(guó)存力規(guī)模達(dá)1680EB,國(guó)產(chǎn)存儲(chǔ)介質(zhì)、芯片、系統(tǒng)實(shí)現(xiàn)三級(jí)突破
- 云知聲智能語(yǔ)音芯片榮膺2025物聯(lián)網(wǎng)大會(huì)特色成果,以端側(cè)智能引領(lǐng)AIoT產(chǎn)業(yè)邁入“芯”紀(jì)元
- 信銳極智網(wǎng)絡(luò):獨(dú)立AI芯片加持,引領(lǐng)交換機(jī)智能運(yùn)維新范式!
- 突發(fā)!網(wǎng)傳聯(lián)發(fā)科天璣9500芯片AI算力翻倍
- 英特爾公開演示18A制程已適配非x86架構(gòu)SoC芯片,開辟全新市場(chǎng)前景
- 破局電網(wǎng)結(jié)冰監(jiān)測(cè)“芯”瓶頸!金天弘科技全球首創(chuàng)MEMS結(jié)冰傳感芯片重磅上市成功應(yīng)用
- 特朗普與英偉達(dá)達(dá)成協(xié)議,僅向我國(guó)出售性能降級(jí)版AI芯片,并在營(yíng)收額中抽成15%
- 三星Galaxy S26 Ultra將于2026年迎來(lái)性能飛躍:搭載美光超高速LPDDR5X內(nèi)存與驍龍8 Elite 2芯片組
- “芯片+場(chǎng)景”雙輪驅(qū)動(dòng),云天勵(lì)飛沖刺H股加速技術(shù)商業(yè)化落地
- 蘋果斥資6000億美元實(shí)施美國(guó)制造計(jì)劃,定制芯片全流程生產(chǎn)都在本土完成
- 國(guó)內(nèi)首證!馳芯半導(dǎo)體CX500車規(guī)級(jí)UWB SoC芯片通過FiRa Core 3.0認(rèn)證
- 云天勵(lì)飛擬赴港上市:中國(guó)AI推理芯片獨(dú)角獸
- 深度解讀!格力車規(guī)級(jí)芯片斬獲三項(xiàng)國(guó)際認(rèn)證,憑啥這么牛?
- WAIC 2025|芯馳科技分享AI座艙芯片“最優(yōu)解”
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場(chǎng)景AI,傳音手機(jī)推動(dòng)前沿科技落地新興市場(chǎng)
- 神眸BC22+全新上市,重新定義“真無(wú)線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計(jì)白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬(wàn)克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國(guó)
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會(huì)隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營(yíng)報(bào)名企業(yè)超300家
- 首都機(jī)場(chǎng)“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來(lái)
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國(guó)首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來(lái)——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級(jí)!率先適配 “液態(tài)玻璃”,原生體驗(yàn)更極致
- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來(lái)落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢(shì)科技,提升科研數(shù)據(jù)處理效能