SuperCLUE發(fā)布工業(yè)大模型測評最新榜單,北電數(shù)智驕陽·工業(yè)大模型綜合排名第一
2025-07-25 14:30:55AI云資訊1974
7月24日,國內(nèi)權(quán)威第三方評測機構(gòu) SuperCLUE 發(fā)布中文原生工業(yè)大模型測評基準(zhǔn) SC-Industry(SuperCLUE-Industry)最新榜單。北電數(shù)智驕陽·工業(yè)大模型以83.44 的總分綜合排名第一。
圖注:SuperCLUE 發(fā)布工業(yè)大模型能力象限
SuperCLUE 是行業(yè)權(quán)威的通用大模型綜合性測評基準(zhǔn),專注于中文大模型測評;SC-Industry立足中文語義環(huán)境與工業(yè)場景,充分貼合國內(nèi)制造業(yè)的術(shù)語體系與應(yīng)用需求,全面地衡量工業(yè)大模型除知識庫之外解決行業(yè)具體問題的應(yīng)用能力,兼具工業(yè)領(lǐng)域模型的通用性與可拓展性。
SC-Industry評測從基礎(chǔ)能力和應(yīng)用能力兩大維度出發(fā),聚焦工業(yè)常規(guī)問答、工業(yè)數(shù)據(jù)分析、工業(yè)文檔問答、工業(yè)智能體Agent、工業(yè)理解計算、工業(yè)代碼生成六大能力,對大模型進行效果評估。通過構(gòu)建專用測評集,SC-Industry結(jié)合評估流程、評估標(biāo)準(zhǔn)、評分規(guī)則,將文本輸入送入超級模型,并對每一維度的評估結(jié)果與人類一致性進行分析。
根據(jù)榜單測評結(jié)果,驕陽·工業(yè)大模型在整體總分第一之外,“應(yīng)用能力”綜合測評結(jié)果獲90.07分,同樣位居榜首。
● 在“工業(yè)數(shù)據(jù)分析” 細(xì)分維度上,「驕陽」獲得90.38的最高分,能夠?qū)Ρ砀耦悢?shù)據(jù)進行出色分析并提供深刻洞察。
● 在“工業(yè)智能體Agent”上,驕陽·工業(yè)大模型以89.97分領(lǐng)跑,其在一定的工業(yè)環(huán)境中展現(xiàn)出強大的自主或半自主執(zhí)行任務(wù)能力,能有效做出決策,并與其他系統(tǒng)進行交互以優(yōu)化或輔助工業(yè)流程,特別是在多輪任務(wù)規(guī)劃與工具調(diào)用中表現(xiàn)卓越,這對于復(fù)雜工業(yè)流程的落地至關(guān)重要。
SuperCLUE在報告中指出,產(chǎn)業(yè)級應(yīng)用能力成為新分水嶺。驕陽·工業(yè)大模型憑借在工業(yè)數(shù)據(jù)分析上的強勢表現(xiàn),得到了業(yè)界領(lǐng)先的 90.07 分,首次登頂。這一方面說明在工業(yè)任務(wù)能力方面,國產(chǎn)模型正在突圍;另一方面表明在基礎(chǔ)能力趨同的情況下,工業(yè)數(shù)據(jù)分析與智能體表現(xiàn)將成為拉開差距的關(guān)鍵。
北電數(shù)智以產(chǎn)業(yè)協(xié)同、技術(shù)突破雙輪驅(qū)動破局,一方面推動建立工業(yè)數(shù)據(jù)標(biāo)準(zhǔn)和開放協(xié)議體系,運用可信數(shù)據(jù)空間技術(shù)實現(xiàn)數(shù)據(jù)的安全共享;另一方面重點研發(fā)場景化微調(diào)數(shù)據(jù)生成和復(fù)雜任務(wù)強化學(xué)習(xí)等核心技術(shù),有效提升模型的行業(yè)認(rèn)知能力。目前,驕陽·工業(yè)大模型已成功構(gòu)建“精準(zhǔn)的垂類認(rèn)知、高質(zhì)量數(shù)據(jù)治理體系、嚴(yán)格的安全合規(guī)管控機制”三大優(yōu)勢,展現(xiàn)了北電數(shù)智在垂類大模型領(lǐng)域的階段性研發(fā)成果,也體現(xiàn)了依托北京電控深厚工業(yè)基因的差異化競爭能力。
在即將到來的2025 WAIC世界人工智能大會上,北電數(shù)智將正式發(fā)布驕陽·工業(yè)大模型,并聚焦工業(yè)企業(yè)最關(guān)注的“AI+生產(chǎn)、AI+產(chǎn)品、AI+運營、AI+基礎(chǔ)設(shè)施”等核心業(yè)務(wù)場景,分享北電數(shù)智的創(chuàng)新能力和標(biāo)桿實踐,敬請關(guān)注。
相關(guān)文章
- SuperCLUE測評榜單第一!驕陽·工業(yè)大模型正式發(fā)布
- SuperCLUE發(fā)布工業(yè)大模型測評最新榜單,北電數(shù)智驕陽·工業(yè)大模型綜合排名第一
- 創(chuàng)新奇智工業(yè)大模型項目入選聯(lián)合國“AI for Good”全球創(chuàng)新案例集
- 京東工業(yè)大模型Joy industrial發(fā)布 京東產(chǎn)業(yè)場景再結(jié)大模型碩果
- 京東工業(yè)發(fā)布工業(yè)大模型Joy industrial并啟動上?!版渼颖姵?萬億降本”計劃
- 京東工業(yè)大模型Joy industrial宣布上線 重塑工業(yè)供應(yīng)鏈價值鏈
- 中能拾貝:IDC報告中的工業(yè)大模型新秀,拾貝云CyberwLLM領(lǐng)跑行業(yè)
- 沙利文:最新中國工業(yè)大模型市場份額發(fā)布,華為云位列行業(yè)第一
- 雪浪工業(yè)大模型,首秀來了!
- 創(chuàng)新力拉滿!雪浪工業(yè)大模型平臺入選2024年度江蘇省工業(yè)軟件優(yōu)秀產(chǎn)品和應(yīng)用解決方案名單
- 神州鯤泰與未必然數(shù)據(jù)科技聯(lián)合打造光宇工業(yè)大模型一體機,推動工業(yè)制造數(shù)字化發(fā)展
- 遠(yuǎn)舢智能入選IDC先進工業(yè)控制及工業(yè)大模型典型代表企業(yè)
- CVPR 2024:中科視語領(lǐng)跑工業(yè)大模型,工業(yè)混合專家模型再奪桂冠
- 連接未來,智造無限|長三角工業(yè)大模型應(yīng)用創(chuàng)新大會于蘇州成功舉辦
- 重磅發(fā)布!格創(chuàng)東智章魚工業(yè)大模型,激發(fā)工業(yè)智能的無限可能!
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
- 中國移動將支持eSIM全系產(chǎn)品,釋放成長新動能
- 晟聯(lián)科:以高速互連接口IP方案賦能Scale-up 生態(tài)
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案