想法流x商湯科技大裝置:端到端全棧賦能,造就現(xiàn)象級應(yīng)用
2025-06-18 14:48:38AI云資訊999
由想法流打造的“造夢次元”,是由多模態(tài)AI驅(qū)動的新一代內(nèi)容平臺,得益于商湯大裝置AIGC解決方案從算力到模型的端到端支持,通過算力和模型、模型和應(yīng)用之間的緊密協(xié)同,既創(chuàng)造了最佳的用戶體驗(yàn),又獲得了最大化的成本效益,如今已成為一款日均活躍互動時間超過100分鐘的現(xiàn)象級應(yīng)用。
50%成本節(jié)省、3~5倍推理時延降低、100%的QPS(每秒請求數(shù))提升!
想法流合伙人、Studio負(fù)責(zé)人張鴻表示:“商湯大裝置展現(xiàn)出三重核心優(yōu)勢:一是算力與模型的深度協(xié)同,實(shí)現(xiàn)最高效的資源利用;二是針對文本、語音、圖像等不同模態(tài)的協(xié)同,構(gòu)建了流暢自然的交互體驗(yàn);三是支持開源模型的完善生態(tài),提供了多樣化模型選擇。這種多維度協(xié)同優(yōu)勢助力我們完成了‘算力、模型、應(yīng)用’三位一體的全鏈條優(yōu)化,推動技術(shù)效能向商業(yè)價值的高效轉(zhuǎn)化?!?
日均6000萬次調(diào)用、千億token消耗,帶來三大「生存挑戰(zhàn)」
基于對用戶需求的洞察,想法流通過技術(shù)創(chuàng)新直擊AI互動應(yīng)用普遍存在的“沉浸感不足”和“門檻過高”兩大核心問題。例如,通過提供文字、語音、文圖結(jié)合的多模態(tài)交互,讓用戶與 AI 的互動體驗(yàn)趨近真實(shí)人際交流。此外,想法流還提供豐富的創(chuàng)作工具,用戶只需套用相關(guān)模板,就可快速搭建完整互動內(nèi)容,有效降低了創(chuàng)作門檻。
造夢次元每日平均模型調(diào)用量高達(dá)6000多萬次,一天消耗的token達(dá)千億級別。在如此龐大的規(guī)模下,任何卡頓、宕機(jī)、出錯都會導(dǎo)致嚴(yán)重的用戶流失;任何因模型能力不足造成的體驗(yàn)不佳,都會影響產(chǎn)品口碑;任何微小的資源閑置,都會累計(jì)成巨大的成本開銷。擺在想法流面前的“生存挑戰(zhàn)”,主要體現(xiàn)在三個層面:
2倍峰谷差的算力彈性戰(zhàn):造夢次元的平臺流量有著鮮明的潮汐特征,周末和節(jié)假日高峰時段的流量可達(dá)低谷時期2倍,對基礎(chǔ)設(shè)施算力資源有很強(qiáng)的彈性伸縮需求。
推理時延的2秒生死線:虛擬角色互動場景對時延極為敏感,要保證基本流暢的交互體驗(yàn),模型推理時延需穩(wěn)定控制在2秒以內(nèi)。
模型迭代的穩(wěn)定性挑戰(zhàn):想法流采用了很多開源模型,需要跟隨社區(qū)節(jié)奏進(jìn)行頻繁升級甚至替換。需求多、更新頻,如何保證業(yè)務(wù)穩(wěn)定運(yùn)行也至關(guān)重要。
高峰秒級響應(yīng)不卡頓、低谷資源釋放不浪費(fèi)
商湯大裝置作為“最懂大模型的AI基礎(chǔ)設(shè)施”,為想法流提供了從算力到模型的全鏈路一體化AIGC整體解決方案,一站式支撐想法流的產(chǎn)品研發(fā)及運(yùn)營需求,做到“高峰秒級響應(yīng)不卡頓、低谷資源釋放不浪費(fèi)”。
秒級彈性伸縮:成本暴降50%,流量潮汐從容應(yīng)對
面對流量峰谷波動挑戰(zhàn),商湯大裝置通過實(shí)時監(jiān)測、統(tǒng)一調(diào)度、智能擴(kuò)縮容的組合策略,實(shí)現(xiàn)秒級彈性伸縮,為想法流的整體運(yùn)營成本降低了50%。其中,智能化統(tǒng)一調(diào)度結(jié)合監(jiān)測系統(tǒng)實(shí)時抓取的業(yè)務(wù)指標(biāo),根據(jù)推理業(yè)務(wù)擴(kuò)縮容規(guī)則自動分配資源,實(shí)現(xiàn)算力與流量的精準(zhǔn)匹配;并結(jié)合定時擴(kuò)縮容與按需擴(kuò)縮容的雙重策略,進(jìn)一步提升彈性伸縮的靈活性。
全鏈路優(yōu)化:5倍推理時延降低、100%QPS提升
想法流將“人均互動次數(shù)”作為判斷模型體驗(yàn)的綜合指標(biāo),推理時延和QPS正是影響該指標(biāo)的關(guān)鍵因素。商湯大裝置通過硬件資源、軟件框架、算法模型等多維度協(xié)同優(yōu)化,使推理時延降低3~5倍。
另外,在秒級彈性伸縮的基礎(chǔ)上,商湯大裝置還通過全鏈路量化加速、流量分級與降級等專項(xiàng)優(yōu)化,可在高峰期優(yōu)先保障高價值業(yè)務(wù)的響應(yīng)速度,最終將QPS提升100%,以更快的響應(yīng)速度提升用戶體驗(yàn)。
商湯日日新多模型組合,“人均互動次數(shù)”翻倍提升
“人均互動次數(shù)”另一個影響因素在于模型能力,商湯以商量語言大模型、商量擬人對話模型、文生圖模型秒畫等多模型組合,為造夢次元用戶帶來“更懂人心”的交互體驗(yàn)。
其中,商量語言大模型以精準(zhǔn)的上下文語義分析、意圖推理及對人類情感的細(xì)致感知與回應(yīng),助力造夢次元以擬人化思維打造沉浸式交流體驗(yàn)。同時,依托商量擬人對話模型領(lǐng)先的角色對話、人設(shè)、及劇情推動能力,幫助想法流用戶打造IP角色,為用戶提供高擬真對話體驗(yàn)。此外,創(chuàng)作者可使用秒畫的普通生圖、CN生圖、換臉、擴(kuò)圖等功能,進(jìn)行各類虛擬角色設(shè)計(jì)。
基于基礎(chǔ)設(shè)施的系統(tǒng)優(yōu)化和雙方的模型共創(chuàng),造夢次元的“人均互動次數(shù)”從初期 20 輪提升至 40~50 輪,用戶粘性實(shí)現(xiàn)跨越式增長。
可靠全面穩(wěn)定性保障:模型隨時升,業(yè)務(wù)不斷點(diǎn)
針對想法流高頻次的模型切換,以及開源模型頻繁的版本升級給業(yè)務(wù)運(yùn)營帶來的穩(wěn)定性挑戰(zhàn),商湯大裝置針對推理階段構(gòu)建了涵蓋模型灰度發(fā)布、滾動升級與智能運(yùn)維的全面穩(wěn)定性保障體系,不僅為模型快速迭代提供了有效支撐,也確保了在線業(yè)務(wù)的穩(wěn)定運(yùn)行。
日均活躍超100分鐘,構(gòu)建新型內(nèi)容消費(fèi)生態(tài)
短短兩年時間,“造夢次元”已發(fā)展成為擁有數(shù)百個萬粉級別IP角色,日均活躍互動時間超過100分鐘的應(yīng)用平臺,是大量年輕用戶娛樂、情感表達(dá)和學(xué)習(xí)陪練的重要伙伴。未來,雙方還將聚焦多模態(tài)模型能力深化合作,給用戶帶來更新奇、更有趣的AI互動之旅。
商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆認(rèn)為:“商湯大裝置與想法流的合作,是對商湯科技‘大裝置-大模型-應(yīng)用’三位一體戰(zhàn)略價值的最佳詮釋?;趹?yīng)用場景特點(diǎn)開展模型能力共創(chuàng),訓(xùn)練高度貼合業(yè)務(wù)需求的垂類模型,并針對模型調(diào)用需求提供最優(yōu)的基礎(chǔ)設(shè)施支持,給予靈活的彈性伸縮、極低的推理時延和穩(wěn)定性保障,最終實(shí)現(xiàn)降本增效和用戶滿意度的提升。大模型算法與基礎(chǔ)設(shè)施的聯(lián)合優(yōu)化,不僅是驅(qū)動生成式AI發(fā)展的核心動力,也是實(shí)現(xiàn)最大化商業(yè)價值的最優(yōu)路徑?!?
相關(guān)文章
- 商湯科技連續(xù)九年領(lǐng)跑中國計(jì)算機(jī)視覺市場,CV 2.0時代再顯龍頭實(shí)力
- 曦望與商湯科技、無極資本達(dá)成戰(zhàn)略合作,共拓中國AI算力生態(tài)新高地
- 值得買科技與商湯科技達(dá)成戰(zhàn)略合作,共聚WAIC探索消費(fèi)智能體新機(jī)遇
- 商湯科技即將發(fā)布“日日新6.5”,多項(xiàng)產(chǎn)品升級驅(qū)動生產(chǎn)力革新和交互升級
- 商湯科技計(jì)劃進(jìn)軍具身智能:核心團(tuán)隊(duì)已初步組建完畢
- 商湯科技將在2025WAIC發(fā)布日日新6.5大模型及具身智能平臺
- 中韓科技對話再升級,韓國高規(guī)格代表團(tuán)到訪商湯科技
- 國內(nèi)首家!商湯科技大裝置萬象獲得中國信通院“大模型推理平臺”最高評級認(rèn)證
- 云知聲與商湯科技達(dá)成戰(zhàn)略合作 推動多模態(tài)智能交互協(xié)同進(jìn)化
- 商湯科技與云知聲達(dá)成戰(zhàn)略合作 推動多模態(tài)智能交互協(xié)同進(jìn)化
- 想法流x商湯科技大裝置:端到端全棧賦能,造就現(xiàn)象級應(yīng)用
- 商湯科技擔(dān)當(dāng)引領(lǐng)者,牽動XR及虛擬數(shù)字人標(biāo)準(zhǔn)化未來
- 商湯科技當(dāng)選工信部人工智能標(biāo)準(zhǔn)技術(shù)委員會首屆委員單位
- 商湯科技董事長徐立:強(qiáng)化創(chuàng)新,以人工智能助力高質(zhì)量發(fā)展
- 鈦動科技閃耀量子位MEET 2025,與零一萬物、商湯科技等共探AI新浪潮
- 商湯科技與中智股份達(dá)成合作,AI大模型賦能人力資源能力躍遷
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強(qiáng)勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運(yùn)載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案