上海AI獨角獸MiniMax發(fā)布新一代開源模型,創(chuàng)新突破受海內(nèi)外好評
2025-01-25 10:22:44AI云資訊235723
日月開新元,萬象啟新篇。
1月15日,MiniMax發(fā)布并開源新一代01系列模型,包含基礎(chǔ)語言大模型 MiniMax-Text-01 和視覺多模態(tài)大模型MiniMax-VL-01。該系列模型使用多項突破性創(chuàng)新,以大規(guī)模應(yīng)用線性注意力機制打破Transformer傳統(tǒng)架構(gòu)記憶瓶頸,在綜合性能比肩GPT-4o、Claude-3.5等海外領(lǐng)軍模型的基礎(chǔ)上,能夠高效處理高達(dá)400萬token的輸入,可輸入長度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。
目前,MiniMax-01系列開源模型已應(yīng)用于MiniMax旗下產(chǎn)品海螺AI并在全球上線,企業(yè)與個人開發(fā)者可前往MiniMax開放平臺使用API。
以架構(gòu)創(chuàng)新實現(xiàn)高效超長文本輸入
2017年,具有里程碑意義的論文《Attention Is All You Need》正式發(fā)表,Transformer架構(gòu)問世并逐步發(fā)展成為該領(lǐng)域的主流技術(shù)范式。自2023年起,自然語言處理領(lǐng)域迎來了一股創(chuàng)新浪潮,對模型架構(gòu)的創(chuàng)新需求日益增加。
MiniMax-01系列模型首次將線性注意力機制擴展到商用模型的級別,并使其綜合能力達(dá)到全球第一梯隊。而受益于此次架構(gòu)創(chuàng)新,該系列模型在處理長輸入的時候具有非常高的效率,接近線性復(fù)雜度。從Scaling Law、與MoE的結(jié)合、結(jié)構(gòu)設(shè)計、訓(xùn)練優(yōu)化和推理優(yōu)化等層面綜合考慮,MiniMax選擇模型參數(shù)量為4560億,其中每次激活459億,能夠高效處理高達(dá)400萬token的上下文,將有效替代Transformer傳統(tǒng)架構(gòu)并開啟超長文本輸入時代。
MiniMax-01模型發(fā)布后,在國內(nèi)外迅速掀起了熱議浪潮。海外媒體與AI從業(yè)者聚焦該模型,深入探討其技術(shù)內(nèi)涵與潛在價值,對其所展現(xiàn)出的創(chuàng)新性給予了高度肯定。
性能比肩國際領(lǐng)軍模型
在應(yīng)用創(chuàng)新架構(gòu)之外,MiniMax大規(guī)模重構(gòu)了01系列模型的訓(xùn)練和推理系統(tǒng),包括更高效的MoE All-to-all通訊優(yōu)化、更長的序列的優(yōu)化,以及推線性注意力層的高效Kernel實現(xiàn),使得模型能力可與全球頂級閉源模型相媲美。
在業(yè)界主流的文本和多模態(tài)理解任務(wù)處理表現(xiàn)上,MiniMax-01系列模型大多情況下可以追平海外公認(rèn)最先進的兩個模型,GPT-4o-1120以及Claude-3.5-sonnet-1022。過往的模型能力評測中,Google的自研模型Gemini有著顯著的長文優(yōu)勢。而在01系列模型參評的長文任務(wù)下,相較于Gemini等一眾全球頂級模型,MiniMax-01隨著輸入長度變長,性能衰減最慢,效果及其出眾。
▲ 多項任務(wù)評測結(jié)果顯示,MiniMax-01系列模型核心性能穩(wěn)居全球第一梯隊。(圖源MiniMax-01系列模型技術(shù)報告)
▲ MiniMax-01系列模型長上下文處理能力全球領(lǐng)先。(圖源MiniMax-01系列模型技術(shù)報告)
▲ MiniMax-01系列模型長上下文處理能力在LongBench V2第三方評測成績僅次于OpenAI的o1-preview和人類。(注:LongBench V2是面向現(xiàn)實情景,進行長上下文多任務(wù)深入理解和推理的測試集。)
加速AI Agent時代到來
2025年,AI將迎來至關(guān)重要的發(fā)展節(jié)點,AI Agent有望成為新一年最重要的產(chǎn)品形態(tài),引領(lǐng)AI從傳統(tǒng)的“工具”角色向更具互動性與協(xié)作性的“伙伴”角色轉(zhuǎn)變。AI Agent時代,由于智能體處理的任務(wù)變得越來越復(fù)雜,涉及的數(shù)據(jù)量也越來越大,單個智能體的記憶以及多個智能體協(xié)作間的上下文都會變得越來越長。因此,長上下文能力與多模態(tài)處理能力的提升,是AI Agent為各行業(yè)帶來更為豐富、高效、智能的解決方案的必要條件。
MiniMax在Github上開源了Text-01模型、VL-01模型的完整權(quán)重,以便于更多開發(fā)者做有價值、突破性的研究。MiniMax創(chuàng)始人、CEO閆俊杰表示,“這是我們第一個開源系列模型。我們認(rèn)為真正有價值的事,不是當(dāng)前做得怎么樣,而是技術(shù)進化速度。而開源會加速技術(shù)進化,做得好的地方有鼓勵,不好的地方會有很多批評,外面的人也會有貢獻,這是我們開源的最大驅(qū)動力。”
憑借開放、共享、協(xié)作的特點,開源模型激發(fā)AI產(chǎn)業(yè)的創(chuàng)新活力,正在成為賦能新質(zhì)生產(chǎn)力發(fā)展的關(guān)鍵引擎。受益于Linear Attention層面的架構(gòu)創(chuàng)新、算力層面的優(yōu)化,以及集群上的訓(xùn)推一體的設(shè)計,MiniMax以業(yè)內(nèi)極具性價比的價格提供文本模型和多模態(tài)理解模型的API服務(wù),標(biāo)準(zhǔn)定價是輸入token 1元/百萬token,輸出token 8元/百萬token。
相關(guān)文章
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機器人技能大賽在滬啟動,助推智能建造實戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案