兩大AI模型性能提升 登上國際榜單
2025-01-16 11:19:55AI云資訊170162
近日,由盛大AI團(tuán)隊研發(fā)的模型Watt-tool-70B和Newsbang/homer-72B,登上國際知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt團(tuán)隊研發(fā)的旗艦?zāi)P?,目前位列BFCL Leaderboard總榜單第一。
據(jù)悉,榜單BFCL Leaderboard是由加州大學(xué)伯克利分校開發(fā)的評估LLM工具調(diào)用能力基準(zhǔn)測試平臺。作為目前大語言模型(LLM)最熱門的研究方向之一,工具調(diào)用(Function-Calling)是為了讓LLM理解,并能準(zhǔn)確使用API(應(yīng)用程序編程接口),來執(zhí)行更復(fù)雜而具體的任務(wù)。在近期公布的最新一輪評估結(jié)果中,Watt的“多輪對話執(zhí)行能力”相較于排名第二的GPT-4o 領(lǐng)先11分,比排名第十的Gemini-1.5-Pro 領(lǐng)先近40分。
“這個模型將加速大模型落地‘融合’過程?!盬att有關(guān)負(fù)責(zé)人說,還有助于從底層數(shù)據(jù)標(biāo)注到人機(jī)交互的體系化建設(shè),讓大模型初步實(shí)現(xiàn)從“光說不練”到“能文能武”。
此外,由盛大集團(tuán)NewsBang團(tuán)隊開發(fā)的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護(hù)的開源語言模型評測平臺升級版本,采用更全面和嚴(yán)格評估標(biāo)準(zhǔn),對各類開源大語言模型進(jìn)行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力,通過搭配數(shù)據(jù)篩選機(jī)制等,在多個核心評測維度,該模型性能有了大幅提升。

據(jù)公開報道,2023年初,盛大集團(tuán)宣布All in AI戰(zhàn)略,去年10月,聯(lián)合多家高校發(fā)表了AI與長期記憶方面的論文,其自研的OMNE大模型多智能體框架登上GAIA 基準(zhǔn)測試排行榜榜首;其旗下的天橋腦科學(xué)研究院(TCCI)與國際學(xué)術(shù)雜志《Science》合作推出全球AI驅(qū)動科學(xué)大獎,舉辦和支持包括“AI+精神健康”在內(nèi)的各種高水平國際會議和夏校項目,助力培養(yǎng)跨學(xué)科青年AI人才等。
相關(guān)文章
- IBM攜手歐萊雅推出首個AI模型,助力可持續(xù)、數(shù)據(jù)驅(qū)動的化妝品研發(fā)
- 兩大AI模型性能提升 登上國際榜單
- 微軟澄清:不會使用用戶的Word和Excel數(shù)據(jù)來訓(xùn)練AI模型
- 英偉達(dá)推出可創(chuàng)作音樂、修改語音的AI模型Fugatto
- Adobe進(jìn)軍生成式人工智能視頻領(lǐng)域 推出文生視頻AI模型
- 英偉達(dá)與Mistral AI聯(lián)合發(fā)布企業(yè)級AI模型Mistral-NeMo AI
- JFrog收購Qwak AI,致力于簡化AI模型從開發(fā)到生產(chǎn)的全流程
- 基石智算帶來AI模型應(yīng)用新體驗(yàn),高效、靈活、無憂
- 學(xué)習(xí)曲線4:更精進(jìn)的AI模型與不斷演進(jìn)的語言
- 英特爾AI平臺在微軟Phi-3 AI模型發(fā)布當(dāng)天即實(shí)現(xiàn)優(yōu)化支持
- SAS打包AI模型促進(jìn)行業(yè)解決方案提升
- 高效、高質(zhì)的AI數(shù)據(jù),將進(jìn)一步推動AI模型性能突破
- 浮點(diǎn)智算定制化AI模型算力服務(wù)方案,助力發(fā)展新質(zhì)生產(chǎn)力
- 天璣9300支持AI模型端側(cè)技能擴(kuò)充技術(shù),最豐富的端側(cè)生成式AI體驗(yàn)來了!
- 華為盤古氣象AI模型提供天氣事件秒級預(yù)報:免費(fèi)向公眾發(fā)布
- 世界互聯(lián)網(wǎng)大會“AI模型大戰(zhàn)”打響,微美全息積極加入行業(yè)軍備賽
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強(qiáng)勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運(yùn)載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實(shí)現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案