最新報告揭曉智慧芽專利大模型在知產(chǎn)領(lǐng)域表現(xiàn)超越GPT-4的技術(shù)細節(jié)
2024-05-09 11:43:54AI云資訊1286
4月28日,科技創(chuàng)新與知識產(chǎn)權(quán)信息服務(wù)商智慧芽旗下的大模型開發(fā)團隊在arXiv發(fā)表技術(shù)報告PatentGPT: A Large Language Model for Intellectual Property(智慧芽專利大模型:一個應(yīng)用于知識產(chǎn)權(quán)領(lǐng)域的大語言模型),介紹“智慧芽專利大模型”的訓練策略,及其在知識產(chǎn)權(quán)場景表現(xiàn)超越GPT-4等方面的應(yīng)用優(yōu)勢。此前,智慧芽已發(fā)布“垂直領(lǐng)域大模型”并成功訓練“專利大模型”和“生物醫(yī)藥大模型”。
arXiv是國際知名的學術(shù)平臺,于1991年創(chuàng)立,目前在物理、數(shù)學、計算機科學等八個主題領(lǐng)域,收錄了超過200萬篇學術(shù)文章,由康奈爾大學的arXiv領(lǐng)導團隊及工作人員維護運營。
在該篇技術(shù)報告中,智慧芽提出了一種用于訓練面向知識產(chǎn)權(quán)領(lǐng)域的大語言模型,滿足知產(chǎn)領(lǐng)域的獨特需求。該模型在2019年中國專利代理師資格考試中成績超過GPT-4,達到了人類專家水平。同時,鑒于其采用SMoE架構(gòu),因而在長文本任務(wù)上展現(xiàn)了更高的資源效率。此外,智慧芽提出了一個更接近大模型在知識產(chǎn)權(quán)領(lǐng)域用例的基準“PatentBench”,為知產(chǎn)領(lǐng)域大模型的全面評估提供參考。
亮點一:專業(yè)能力超越GPT-4
根據(jù)技術(shù)報告,智慧芽提出了知識產(chǎn)權(quán)領(lǐng)域大模型的標準訓練程序,包括數(shù)據(jù)預(yù)處理、預(yù)訓練、對齊和評估,并基于此訓練了“智慧芽專利大模型”。
為了證明“智慧芽專利大模型”在知識產(chǎn)權(quán)領(lǐng)域的專業(yè)能力,團隊使用2019年中國專利代理師資格考試對各項大模型進行測試。實驗結(jié)果表明,商業(yè)通用大模型未能通過考試及格線,而“智慧芽專利大模型”取得65分,達到知識產(chǎn)權(quán)專家的水平。上述結(jié)果揭示了通用大模型在知識產(chǎn)權(quán)領(lǐng)域?qū)I(yè)能力的不足,并再次強調(diào)了預(yù)訓練領(lǐng)域特定大模型的有效性和必要性。
上圖呈現(xiàn)了智慧芽專利大模型考試成績高于商業(yè)通用大模型(圖源arXiv)
需要強調(diào)的是,上述考試結(jié)果不僅僅是通過將知識產(chǎn)權(quán)知識整合到模型中實現(xiàn)的,還通過一系列數(shù)據(jù)增強技術(shù)提高了模型消除選項順序干擾的能力,這種能力可以用PPA來表示。結(jié)果顯示,“智慧芽專利大模型”的PPA顯著優(yōu)于GPT-4-1106-preview。
在技術(shù)報告中,智慧芽還使用了MoZIP,一項專門為知識產(chǎn)權(quán)行業(yè)大模型設(shè)計的開源測試基準,包含三項挑戰(zhàn)任務(wù):IP基礎(chǔ)知識多項選擇測驗(IPQuiz)、IP基礎(chǔ)知識問答(IPQA)和專利內(nèi)容匹配(PatentMatch)。
其中,“智慧芽專利大模型”在專利內(nèi)容匹配任務(wù)上的表現(xiàn)均超過了GPT-3.5-turbo,這表明智慧芽大模型在把握各種專利之間的關(guān)系方面更為優(yōu)秀,該能力有助于協(xié)助專利審查員識別潛在的侵權(quán)內(nèi)容??梢?,智慧芽的預(yù)訓練數(shù)據(jù)和策略有效提高了大模型在知識產(chǎn)權(quán)領(lǐng)域的性能。
上圖呈現(xiàn)了智慧芽專利大模型在專利內(nèi)容匹配任務(wù)上的表現(xiàn)優(yōu)異(表源arXiv)
亮點二:推理效率更勝一籌
除了性能外,模型的響應(yīng)延遲和運營成本對于其商業(yè)可行性至關(guān)重要。智慧芽大模型開發(fā)團隊對所有“智慧芽專利大模型”進行了4位量化,并使用了Text-Generation-Inference(TGI)-1.4來評估它們在輸出第一個標記時的資源消耗。所有實驗都在配備NVIDIA A100 80GB GPU的服務(wù)器上進行。
下圖展示了輸入序列長度與推理階段資源消耗之間的關(guān)系。結(jié)果表明,所有模型的GPU內(nèi)存使用量與它們的參數(shù)數(shù)量和輸入序列長度都呈正相關(guān)。其中,“智慧芽專利大模型-1.0-MoE”在輸入序列長度增加時GPU內(nèi)存使用量的增加最小,表明其在涉及長上下文場景的應(yīng)用中更具資源效率。
上圖呈現(xiàn)了智慧芽專利大模型-1.0-MoE在長上下文場景應(yīng)用中更具資源效率(圖源arXiv)
實驗結(jié)果還揭示了在模型性能水平幾乎相等的條件下,“智慧芽專利大模型-1.0-MoE”在推理效率方面更勝一籌。知識產(chǎn)權(quán)領(lǐng)域大模型尤為注重長上下文序列的計算資源管理。該模型的設(shè)計允許處理長上下文并保持高性能水平,而不會對系統(tǒng)資源造成不必要的負擔,提供了一個可能的優(yōu)越折衷方案。這或許是在資源管理與處理復雜和長數(shù)據(jù)序列的能力同樣關(guān)鍵的環(huán)境中部署先進的知識產(chǎn)權(quán)導向模型的關(guān)鍵一步。這些發(fā)現(xiàn)表明,類似“智慧芽專利大模型-1.0-MoE”這樣的SMoE模型在知識產(chǎn)權(quán)行業(yè)中得以應(yīng)用的可行性,以及選擇模型架構(gòu)以開發(fā)功能強大、高效和專業(yè)使用的解決方案的重要性。
亮點三:建立PatentBench評測基準
目前市面上缺乏系統(tǒng)性評測大模型在知識產(chǎn)權(quán)領(lǐng)域?qū)I(yè)能力的開源基準,為此智慧芽提出了PatentBench,率先將專利代理和審查過程中涉及的任務(wù),如專利規(guī)格起草、專利分類以及總結(jié)專利的關(guān)鍵技術(shù)點,納入評估知識產(chǎn)權(quán)領(lǐng)域大模型的基準。值得一提的是,智慧芽計劃在2024年第四季度開源PatentBench,為開源社區(qū)和行業(yè)發(fā)展做出貢獻。
PatentBench的主要評估任務(wù)包括:專利問答Patent QA、專利撰寫Patent Writing、專利分類Patent Classification、專利摘要Patent Summary、專利推理Patent Reasoning、專利校正Patent Correction、專利翻譯Patent Translation。
具體來看,智慧芽首先使用GPT-4和NLP中廣泛使用的指標評估“智慧芽專利大模型”在PatentBench上的零樣本性能。為了評估模型的總結(jié)、撰寫和對話能力,使用GPT-4作為評委,對比不同模型輸出結(jié)果的質(zhì)量。
結(jié)果顯示,“智慧芽專利大模型”在起草和知識產(chǎn)權(quán)領(lǐng)域的開放式問答方面顯著優(yōu)于ChatGPT-3.5-turbo,表明“智慧芽專利大模型”有潛力作為專利助手,幫助人類起草專利說明書、閱讀專利以及理解專利法律法規(guī)。
隨后根據(jù)不同的指標評估了分類、審查、翻譯、文本校正和推理能力。“智慧芽專利大模型”在除了推理之外的其他能力上整體優(yōu)于ChatGPT-3.5-turbo。這些結(jié)果證明了智慧芽的預(yù)訓練和專利大模型在知識產(chǎn)權(quán)領(lǐng)域的先進性。
上圖呈現(xiàn)了智慧芽專利大模型在多項能力上表現(xiàn)優(yōu)異(圖源arXiv)
未來,智慧芽大模型的開發(fā)將專注于增強長上下文支持,以滿足更多樣化的知識產(chǎn)權(quán)工作場景。此外,還將積累英文預(yù)訓練語料庫和SFT數(shù)據(jù),以進一步提高智慧芽垂直領(lǐng)域大模型在英文方面的表現(xiàn)。
相關(guān)文章
- 92%學生實現(xiàn)高效突破!她將高中物理考點濃縮為4大模型,逆襲突破成常態(tài)
- 網(wǎng)安周開幕|綠盟大模型能力再獲權(quán)威肯定,持續(xù)推動AI與網(wǎng)絡(luò)安全深度融合
- 網(wǎng)絡(luò)安全領(lǐng)域唯一入選!聯(lián)通數(shù)科網(wǎng)絡(luò)安全大模型入選北京首臺(套)重大技術(shù)裝備目錄
- 亞信科技通過中國信通院首批“大模型應(yīng)用交付總體能力”評估
- 科大訊飛亮相2025服貿(mào)會多個展館,訊飛星火大模型引領(lǐng)AI+產(chǎn)業(yè)融合實踐
- 中國移動助力中國物流打造物流行業(yè)專屬千億級參數(shù)大模型
- 科大訊飛助力中國物流發(fā)布千億參數(shù)“流云”大模型
- 快手發(fā)布多模態(tài)大模型Keye-VL-1.5 8B性能領(lǐng)先、視頻理解能力更強
- 皓麗全球首款四攝AI會議平板:AI全視之眼 + AI智會大模型雙加持
- Soul全雙工語音大模型升級 迭代人機交互體驗感
- 模型選型專題系列 | 業(yè)界首個!元景MaaS平臺上線《大模型選型說明書》
- 獲央視點贊 深蘭科技AI醫(yī)療大模型落地打浦橋街道社區(qū)服務(wù)中心
- 新達內(nèi)與百度智能云達成戰(zhàn)略合作 聯(lián)合培養(yǎng)人工智能大模型人才
- 斑馬AI大模型:為每個孩子提供專屬學習方案
- 打造廣東首個地方文獻專題處理AI大模型,南沙區(qū)圖書館“阿貝數(shù)字人”項目重磅上線!
- 商湯大裝置躋身中國大模型平臺市場頭部廠商,萬象平臺加速AI落地“最后一公里”
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場景AI,傳音手機推動前沿科技落地新興市場
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機房參考設(shè)計白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能