OpenAI發(fā)布一款更便宜、更智能的新模型,命名為GPT-4o Mini
2024-07-19 08:31:03AI云資訊100023
(AI云資訊消息)使用OpenAI的模型構(gòu)建應(yīng)用程序可能會產(chǎn)生巨額費用。沒有能力負擔(dān)費用的開發(fā)者可能會被完全排除在外,并可能選擇更便宜的模型,如谷歌的Gemini 1.5 Flash或Anthropic的Claude 3 Haiku?,F(xiàn)在,OpenAI開始涉足輕量級模型市場了。
“我認為GPT-4o Mini真正體現(xiàn)了OpenAI的使命,即讓AI更廣泛地惠及大眾。如果我們希望AI能為世界每一個角落、每一個行業(yè)、每一個應(yīng)用帶來益處,就必須讓AI更加經(jīng)濟實惠,”負責(zé)API平臺產(chǎn)品的Olivier Godement告訴媒體。
從今天開始,F(xiàn)ree、Plus和Team計劃的ChatGPT用戶可以使用GPT-4o Mini代替GPT-3.5 Turbo,企業(yè)用戶將在下周獲得使用權(quán)限。這意味著對于ChatGPT的用戶來說,GPT-3.5將不再是一個選擇,但如果他們更喜歡不切換到GPT-4o Mini的情況下通過API使用,它仍然可以提供給開發(fā)者。Godement表示,GPT-3.5將在某個時候從API中退役——只是不確定何時。
新的輕量級模型還將在API中支持文本和視覺,OpenAI表示它很快就能處理像視頻和音頻這樣的多媒體輸入和輸出。有了這些功能,這可能會看起來像是更能干的虛擬助手,可以理解你的旅行行程并提供建議。然而,該模型主要用于簡單的任務(wù),所以沒有人會為了省錢而去構(gòu)建一個像Siri一樣的虛擬助手。
這個新模型在Measuring Massive Multitask Language Understanding (MMLU)基準(zhǔn)測試中獲得了82%的成績,該測試包含57個學(xué)術(shù)科目的約16000道多項選擇題。當(dāng)MMLU在2020年首次推出時,大多數(shù)模型在這項測試中的表現(xiàn)都很糟糕,這是有意為之,因為之前的基準(zhǔn)測試已經(jīng)讓模型變得過于先進了。GPT-3.5在這項基準(zhǔn)測試中得分為70%,GPT-4o的得分為88.7%,而谷歌聲稱Gemini Ultra的得分為有史以來最高的90%。相比之下,競爭對手模型Claude 3 Haiku和Gemini 1.5 Flash的得分分別為75.2%和78.9%。
值得注意的是,研究人員對像MMLU這樣的基準(zhǔn)測試持謹慎態(tài)度,因為不同公司在實施測試時略有不同。這使得不同模型的得分難以比較。還有一個問題是,AI可能在數(shù)據(jù)集中包含這些答案,這實際上讓它作弊,通常情況下,沒有第三方評估者參與這一過程。
對于渴望以低成本開發(fā)AI應(yīng)用程序的開發(fā)者來說,GPT-4o Mini的推出為他們提供了另一種工具。OpenAI讓金融科技初創(chuàng)公司Ramp測試了該模型,并使用GPT-4o Mini構(gòu)建了一款工具,從收據(jù)中提取費用數(shù)據(jù)。因此,用戶無需在文本框中費力輸入,而是可以上傳收據(jù)圖片,然后模型會為他們整理好一切。Superhuman是一款電子郵件客戶端,也對GPT-4o Mini進行了測試,并使用它創(chuàng)建了電子郵件回復(fù)的自動提示功能。
目標(biāo)是為開發(fā)人員提供一種輕量級且價格合理的工具,以便他們能夠創(chuàng)建以前無法使用像GPT-4這樣大型且昂貴模型的各種應(yīng)用程序和工具。許多開發(fā)人員在支付運行最健壯模型所需的令人難以置信的計算成本之前,會轉(zhuǎn)向Claude 3 Haiku或Gemini 1.5 Flash。
那么,OpenAI為何花了這么長時間?Godement表示,這是純粹的優(yōu)先級排序問題,因為該公司專注于創(chuàng)建像GPT-4這樣的更大、更好的模型,這需要投入大量人力和計算資源。隨著時間的推移,OpenAI注意到越來越多的開發(fā)人員渴望使用較小的模型,因此該公司決定將資源投入到開發(fā)GPT-4o Mini中。
“我認為它將會非常受歡迎,”Godement說?!安粌H現(xiàn)有使用OpenAI所有AI功能的應(yīng)用程序會喜歡它,而且許多在定價之前推出的應(yīng)用程序也會喜歡它。”
相關(guān)文章
- 微軟與OpenAI達成新協(xié)議,或為OpenAI上市鋪平道路
- 甲骨文與OpenAI達成3000億美元“星際之門”項目協(xié)議 或?qū)⒅厮茉朴嬎闩c人工智能未來
- OpenAI攜AI動畫電影《Critterz》進軍好萊塢
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- OpenAI或于2026年推出自研AI芯片
- 馬斯克起訴OpenAI和蘋果公司,指控ChatGPT和蘋果應(yīng)用商店非法壟斷
- OpenAI對盈利模式持開放態(tài)度 ChatGPT負責(zé)人稱不排除未來加入廣告
- OpenAI奧爾特曼支持腦機接口公司MergeLabs,致力于實現(xiàn)人機智能融合
- OpenAI現(xiàn)場演示翻車?GPT-5發(fā)布會現(xiàn)神圖,奧爾特曼自嘲:圖表重大失誤
- OpenAI推出GPT-5,奧爾特曼盛贊為寫作、編程及人類級推理的最佳模型
- OpenAI發(fā)布開放權(quán)重人工智能模型:采用Apache 2.0開源協(xié)議,支持本地運行
- 生鮮電商Instacart首席執(zhí)行官將于8月18日正式開始執(zhí)掌OpenAI核心業(yè)務(wù)
- 耗資5000億美元的星際之門項目因OpenAI與軟銀內(nèi)部分歧而陷入僵局
- 領(lǐng)先OpenAI三個月,百度文庫GenFlow支持自主調(diào)用數(shù)百Agent、多模內(nèi)容并行生成,2.0版本8月上線
- OpenAI推出新款ChatGPT智能體可以操控整臺電腦并完成任務(wù)
- 被Meta高薪挖角后,OpenAI擬重審薪酬體系
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場景AI,傳音手機推動前沿科技落地新興市場
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機房參考設(shè)計白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能