首次商用試運行,類腦智算集群支持大模型快速推理服務
2025-08-14 14:16:40AI云資訊2136
據(jù)悉,“杭州靈汐類腦智算集群”已于7月底實現(xiàn)了大模型快速推理API的企業(yè)服務試運行。該集群由杭州靈汐類腦科技有限公司牽頭搭建運營,中國電信、中國電子科技南湖研究院以及腦啟社區(qū)作為合作方參與,由杭州電信具體承擔集成建設。該集群部署在中國電信杭州智算中心,算力規(guī)模超200POPS。這也是類腦智算集群在全球范圍內(nèi),首次以支持大模型快速推理的方式,走向商用試運行。
作為類腦智能技術的創(chuàng)新應用成果,該智算集群具有”存算一體、眾核并行、稀疏計算、事件驅動”的特性,可顯著提升計算效率、大幅降低能耗,實現(xiàn)大語言模型推理的“一快、一低、一降”:一是推理速度快,單用戶的推理延遲控制在毫秒級別,速度性能相對于傳統(tǒng)方案有明顯優(yōu)勢(可流暢響應實時交互及長本文深度推理),告別卡頓;二是首token延遲低,可降至百毫秒乃至十毫秒級;三是智算集群的功耗大幅下降,較業(yè)界同等推理算力水平可降低功耗二分之一至三分之二以上。異構融合類腦芯片具有兼容PyTorch框架的類CUDA軟件棧,可直接服務于多類開源大模型的快速推理、而不需要轉換類腦算法。
圖1靈汐智算平臺大模型登錄
圖2靈汐智算平臺大模型快速推理
當前,大模型推理普遍存在吞吐速度慢(每秒十到幾十詞輸出)和高延遲問題(常常超過1秒甚至數(shù)秒),對眾多行業(yè)場景構成了制約。在此背景下,靈汐科技基于類腦智能技術給出了“高實時、高吞吐、低延遲“的推理服務解決方案,將在金融應用、情感陪聊、快速導覽、大規(guī)模數(shù)據(jù)標注以及無人機實時航拍處理、災害預警與應急處置等領域場景逐步落地。據(jù)介紹,該智算集群(中心)將持續(xù)升級,新一代類腦智算高密度計算平臺也將在近期正式發(fā)布推出,集群能效比預計將進一步提升。
相關文章
- “智水云腦·智算未來”昕彤智能·AI智能體 生態(tài)合作大會江蘇站成功召開
- 《2025算力發(fā)展報告》:智算需求迅猛增長,萬卡集群建設加速推進
- 中國移動重磅發(fā)布算網(wǎng)大腦3.0,打造云智算超級智能體
- 智算開放互聯(lián)OISA生態(tài)共建戰(zhàn)略合作成功啟動
- 中國移動亮相2025中國算力大會,以 “智算全景” 展現(xiàn)數(shù)智硬實力
- 中國移動攜產(chǎn)業(yè)伙伴發(fā)布多項云智算領域重要成果
- 中國移動副總經(jīng)理李慧鏑:協(xié)同產(chǎn)業(yè)推動云智算創(chuàng)新發(fā)展
- ?秦淮數(shù)據(jù)“東數(shù)西算”版圖再下一城,3座共計1.2GW零碳智算園區(qū)將落址中衛(wèi)
- 高通量以太網(wǎng)協(xié)議標準發(fā)布,Scale-Out和Scale-Up場景AI智算全覆蓋
- 首次商用試運行,類腦智算集群支持大模型快速推理服務
- 區(qū)域智算中心實踐:多元異構算力驅動科研與產(chǎn)業(yè)升級
- 九章智算云:搶先開啟四大場景普惠化時代
- 商湯大裝置聯(lián)合發(fā)布“算電協(xié)同平臺”,建設綠色智算中心“樣板間”
- 優(yōu)刻得x立昂云數(shù)據(jù),戰(zhàn)略共建AI智算資源池
- 當機器人遇上智算,智算云重寫“具身智能訓練手冊”
- WAIC 2025 | SHIXP將與PPIO共建分布式智算樞紐平臺
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球對話
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案