基于英特爾?至強?處理器,寶德AIGC解決方案加速釋放AI動能
2023-12-28 09:54:23AI云資訊1366
當前,生成式AI和大模型正以燎原之勢走進制造、金融、醫(yī)療、交通、教育等行業(yè)和領域,引發(fā)行業(yè)更多創(chuàng)新和變革,加速全社會數(shù)字化和智能化轉(zhuǎn)型。近日,工信部賽迪研究院發(fā)布報告顯示,2023年我國生成式人工智能市場規(guī)模有望突破10萬億元。作為中國領先的計算產(chǎn)品方案提供商和AI服務器市場TOP3,寶德計算憑借豐富的市場經(jīng)驗和對客戶AI需求的深刻洞察,攜手英特爾AI軟硬件基礎技術,匠心打磨和推出了寶德生成式AI解決方案。
一鍵部署,靈活定制
寶德AIGC解決方案是軟硬一體化解決方案,既可以集群部署也可以單機部署,方案架構包含硬件層、平臺層、服務層和應用層。在硬件層,寶德充分發(fā)揮了20年服務器行業(yè)技術積累,提供涵蓋AI訓練服務器、AI推理服務器和AI邊緣產(chǎn)品等多平臺選擇和可兼容,進行模型的高速訓練、微調(diào)和高效推理。在硬件基礎上,方案采用K8S進行集群資源管理(單機部署采用Docker)。基于雄厚的硬件層和平臺層,在服務層部署了ChatGLM大模型推理服務、由GLM微調(diào)而來的行業(yè)大模型-寶德酒業(yè)大模型推理服務、寶德自研的嵌入數(shù)據(jù)倉庫服務,可以將行業(yè)數(shù)據(jù)轉(zhuǎn)換成向量數(shù)據(jù),存儲到向量數(shù)據(jù)庫中,通過相似度匹配算法查詢出相關內(nèi)容交給大語言模型進行推理、LLM Functions服務,主要讓大語言模型擁有調(diào)用后端接口的能力。基于這些硬件和服務,寶德開發(fā)了諸如聊德寶、AI客服和數(shù)字人等多種AI應用,可廣泛服務于行業(yè)大模型、智能語音助手、網(wǎng)絡直播、線上教育和培訓等領域。
值得一提的是,寶德深耕行業(yè)多年,基于對市場的理解和對客戶生成式AI多樣性的計算需求,可提供生成式AI解決方案的定制化服務。
性能卓越、成本可控
AIGC快速發(fā)展之時,算力越來越緊缺和成本越來越高,逐漸成為影響AIGC發(fā)展和落地應用的“絆腳石”。并且,從大模型的發(fā)展和應用看,AI推理的規(guī)模遠高于訓練,有效降低推理成本成為寶德的思路。對此,寶德技術團隊經(jīng)過反復測試和調(diào)優(yōu),精心準備了全部采用英特爾全新的至強處理器(Max系列)平臺,以及Intel GPU的AIGC解決方案,使其集強大的AI計算、推理性能和卓越的經(jīng)濟效益于一體,以充分釋放AI動能。
第四代英特爾®至強®可擴展處理器MAX系列CPU在大語言模型(LLM)推理方面有獨特優(yōu)勢。它有32至56個內(nèi)核,可提供最高112線程,內(nèi)置英特爾高級矩陣擴展(AMX)的AI加速功能,可幫助諸如圖像識別、對象探測等任務中的張量處理獲得多倍效率提升,并可用于INT8、BF16等不同數(shù)據(jù)格式,性能高達上一代10倍。而且所有MAX處理器都內(nèi)置了64GB的HBM2e 高帶寬內(nèi)存,分為4個16GB的集群,總內(nèi)存帶寬為1 TB / s,能夠解決大模型工作負載經(jīng)常受到內(nèi)存帶寬限制的窘境,數(shù)倍提升推理性能。并且,其價格極具競爭力。
寶德在基于此CPU和Intel Flex GPU的自研服務器PR2715E上開發(fā)部署了LLM方案-聊德寶,它擁有調(diào)用私域數(shù)據(jù)的能力,讓AI應用更加智能化、個性化地為用戶提供服務,目前已經(jīng)應用于寶德服務器AI客服、金沙古酒AI客服、金沙古酒直播數(shù)字人等產(chǎn)品。聊德寶具有快速遷移、便捷部署、多路并發(fā)的顯著優(yōu)勢;最重要的是,該方案價格同比其它常規(guī)方案最高節(jié)約超過50%!
更妙的是,近日寶德服務器全面升級到第五代英特爾®至強®平臺,第五代英特爾®至強®處理器除了具有更可靠的性能和更出色的能效外,它的AI性能大幅度提升,每個內(nèi)核都具備 AI 加速功能,無需添加獨立加速器,就可處理要求嚴苛的 AI 工作負載,包括對參數(shù)量多達 200 億的模型進行推理和調(diào)優(yōu)。 因此寶德AIGC解決方案將進一步測試適配升級到第五代英特爾®至強®平臺,為客戶部署AI應用提供更具性價比的優(yōu)選方案。
大模型和AIGC正在日新月異地蓬勃發(fā)展,加速應用場景落地和引領產(chǎn)業(yè)變革勢不可擋。寶德將繼續(xù)攜手英特爾,發(fā)揮AI優(yōu)勢,聯(lián)合創(chuàng)新研發(fā)和應用,不斷迭代優(yōu)化生成式AI解決方案,為數(shù)據(jù)中心等客戶打造高效便利和更加普惠的AI基礎設施,加速釋放AI動能,更好地服務中國數(shù)字經(jīng)濟高質(zhì)量發(fā)展!
相關文章
- 英特爾中國區(qū)董事長王銳將于本月榮休
- 下一個爆款在哪兒 2025英特爾人工智能創(chuàng)新應用大賽獲獎名單揭曉
- 官宣:美國政府89億美元入股英特爾,持股比例9.9%
- 投行稱英特爾想要成功轉(zhuǎn)型仍面臨漫長征程
- 聚焦液冷痛點:英特爾UQD互換性認證助力數(shù)據(jù)中心高效發(fā)展
- 軟銀投資20億美元入股英特爾,布局美國半導體制造擴張戰(zhàn)略
- 英特爾公開演示18A制程已適配非x86架構SoC芯片,開辟全新市場前景
- 英特爾AI PC應用新突破!三大應用重磅上線
- 英特爾的務實轉(zhuǎn)向:從技術導向到客戶共振
- 英特爾至強6助力阿里云第九代企業(yè)級ECS實例100天贏得超萬家客戶青睞
- 英特爾CEO陳立武:朝著正確方向砥礪前行
- 英特爾CEO陳立武的轉(zhuǎn)型計劃未能打動銀行業(yè)巨頭摩根大通
- 英特爾今年將裁員2.4萬人 并撤出德國、波蘭和哥斯達黎加市場
- 機械革命首批AI高靜游戲本亮相Bilibili World 2025,同英特爾奔赴高能澎湃下一局
- RealSense從英特爾分拆,融資5千萬美元加速機器人及生物識別AI視覺技術
- 英特爾攜手雷神共推AI高靜游戲本概念,ZERO 16 Pro帶來全能游戲體驗
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案