ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?
2024-05-11 14:02:22AI云資訊816
隨著人工智能技術(shù)的飛速發(fā)展,大語言模型(Large Language Models, LLMs)在各行各業(yè)的應用日益廣泛,尤其是在軟件開發(fā)、數(shù)據(jù)分析、客戶服務等領(lǐng)域。蘑菇云創(chuàng)客空間[445期開放夜]就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型的測評。開放夜現(xiàn)場測評了十幾個國內(nèi)外大語言模型,測評角度從邏輯、數(shù)學、翻譯、倫理等方面,深入探討和體驗了這些大語言模型的實際效能。
測評的大語言模型:
1.Kimi 智能助手:由月之暗面科技有限公司開發(fā)的先進AI。
2.智譜清言:由智言科技開發(fā)的大語言模型,以深度學習和自然語言處理技術(shù)見長。
3.訊飛星火:科大訊飛推出的創(chuàng)新語言模型。
4.文心一言:百度的前沿語言模型,致力于理解和生成自然語言。
5.豆包:專注于提供個性化的智能對話服務。
6.通義千問:以廣泛的知識庫和靈活的對話能力著稱。
7.海螺AI:新興的語言模型,擅長處理復雜的語言任務。
8.騰訊混元助手:騰訊推出的多功能AI助手。
9.Sider: 是由日本公司Sider開發(fā)的大語言模型。
10.ChatGPT:由OpenAI開發(fā),國際上廣受認可的更大規(guī)模、功能更全面的語言模型。
11.Claude:Anthropic開發(fā)的先進語言模型,注重安全性和可靠性。
12.groq:以其專為AI設(shè)計的硬件加速器而聞名。
13.Gemini: OpenAI 開發(fā)的較小規(guī)模的語言模型,旨在提供更高效的計算和資源利用。
14.Mixtral:開源人工智能初創(chuàng)公司 MistralAI開發(fā)的超越GPT-3.5的AI模型
測評問題一: 雞兔同籠的數(shù)學問題
雞兔同籠是一個經(jīng)典的數(shù)學問題,通過觀察雞兔的頭和腳的數(shù)量關(guān)系,可以利用代數(shù)方程來解決問題,從而確定籠子里雞和兔子的數(shù)量。這個問題常常展示了代數(shù)方程組的應用。
針對雞兔同籠的問題,除了Gemini Pro沒有得出正確的結(jié)果,其余的大語言模型都可以給出正確結(jié)果。
測評問題二:翻譯(詩句中翻英)
詩人馬致遠的詩句“斷腸人在天涯”,描寫了“夕陽向西緩緩落下,只有孤獨的旅人漂泊在遙遠的地方?!痹娋涞姆g涉及到文化差異和詩人獨特情感。Mixtral 的語言模型正確的解釋了詩句本身的含義,幫助翻譯者很好地理解這句詩句。 Claude的語言模型對于詩句的本身理解是不正確的。
這句詩翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見,大語言模型可以幫助翻譯者分析這句詩基本的意思,但是涉及文化層面的深層含義,還是做不到意譯的。
開放夜也探討了如下涉及生活、工作的一些問題,比如:
過年福字要倒著貼,那為什么不直接生產(chǎn)倒過來的福字呢?
收到公司的裁員通知郵件,你應該怎么回復郵件來保住工作?
一個烏龜?shù)暨M了井里,井里有30米深。烏龜白天爬3米,晚上滑下2米。問這只烏龜需要多長時間才能爬出井口?
DFRobot AIGC小組主理人夏青在開放夜的現(xiàn)場測評了十幾個國內(nèi)外大語言模型,通過多維度問題的測評,他認為:對于處理綜合性問題,OpenAI的ChatGPT 4.0邏輯清楚,能提供非常有用的信息。盡管在回答一些較為復雜的問題上略顯不足,但在大多數(shù)場合下,其性能仍然令人滿意。然而,ChatGPT 4.0在國內(nèi)的使用成本是一個不容忽視的問題,不僅涉及訂閱費用,也包括使用的技術(shù)門檻。
與此同時,Gemini和Claude等海外語言模型,盡管在遵循指令方面略顯不足,但已達到了實用水平。令人驚喜的是,國內(nèi)的Qwen1.5 72b開源模型在中文理解和特定任務,幾乎能與ChatGPT4.0匹敵此外,其他開源模型如Mixtral和新發(fā)布的LLaMA3雖在邏輯性上略遜于商業(yè)模型如ChatGPT,但總體表現(xiàn)已超越了ChatGPT 3.5。
綜合分析來看,盡管ChatGPT 4.0仍然是目前市場上最優(yōu)秀的大語言模型,但不可忽視的是,無論是國際市場還是國內(nèi)市場,其他廠商的模型均顯示出迅速的進步。開源模型的崛起也證明了開源社區(qū)在AI時代的巨大潛力。當前的大語言模型在處理理性問題方面表現(xiàn)一致,但通常無法提供情緒價值回應。例如,一些國內(nèi)模型如“豆包”將展現(xiàn)其在情緒回應方面的潛力。這種能力的發(fā)展可能為未來陪伴型機器人的商業(yè)模型提供新的方向。
蘑菇云創(chuàng)客空間
蘑菇云創(chuàng)客空間是上海浦東的一家創(chuàng)客空間,是科技部授牌的首批國家級創(chuàng)客空間,由浦軟孵化器提供場地支持、上海智位機器人提供硬件及技術(shù)支持的一家為創(chuàng)客服務的開放式創(chuàng)客空間。擁有獨立的加工室、公共協(xié)作區(qū)域以及儲物、耗材商店,為硬件愛好者、程序員、設(shè)計師、DIY 發(fā)燒友等各類創(chuàng)客,甚至包括進行創(chuàng)新研發(fā)的科創(chuàng)團隊提供一個開放式的社區(qū)化會員空間。
相關(guān)文章
- ICCV 2025 | 騰訊優(yōu)圖實驗室大模型8篇論文入選,涵蓋風格化人臉識別、AI生成圖像檢測、多模態(tài)大語言模型等方向
- 大語言模型升級!時空壺 X1 同聲傳譯器的上限在哪里?
- 時空壺 X1 融入大語言模型,AI 同傳性能飛躍,持續(xù)領(lǐng)航多元場景應用
- 大米和小米推出基于大語言模型全面測評兒童語言能力AI工具
- 新加坡MERaLiON大語言模型創(chuàng)東南亞先河,以多語言處理與情感智能實現(xiàn)技術(shù)突破
- 科大訊飛亮相GITEX ASIA 2025,全球首發(fā)本地部署大語言模型一體化方案
- 「唐能風采」唐能翻譯參與并主持《人人都用得上的翻譯技術(shù)》新書發(fā)布會暨大語言模型賦能沙龍活動
- 極空間私有云聯(lián)合UnifyDrive亮相CES:發(fā)布全球首款大語言模型 AI NAS
- IC China 2024|大語言模型加速半導體制造CIM2.0變革
- 順豐豐語大語言模型來了!物流垂域能力全面超越通用模型,已應用于20余個場景
- 這家頂尖制造企業(yè),如何借助AI大語言模型升級客戶服務?
- PaddleNLP 3.0重磅發(fā)布:開箱即用的產(chǎn)業(yè)級大語言模型開發(fā)利器
- 商湯大語言模型應用SenseChat向香港用戶免費開放,支持廣東話聊天
- WAIC 2023 | 張俊林:大語言模型帶來的交互方式變革
- ABeam(德碩)大語言模型系列(3):企業(yè)如何擁抱大語言模型
- ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案