中國首個專注AI推理的Serverless GPU產(chǎn)品上線:清華力量共績科技驅(qū)動AI普惠
2025-05-26 10:59:06AI云資訊2294
編者按:本文將深入探討AI推理領(lǐng)域面臨的核心挑戰(zhàn),并介紹中國首個專注AI推理的Serverless產(chǎn)品——共績算力AI推理Serverless平臺。我們將解析其技術(shù)亮點、背后源自清華的創(chuàng)業(yè)團隊力量,以及其如何以創(chuàng)新的價格策略,打造中國版的RunPod,賦能廣大開發(fā)者與企業(yè),共同迎接AI普惠時代的到來。
當前AI推理算力市場的結(jié)構(gòu)性問題
隨著AI應(yīng)用的落地增長,推理算力的需求持續(xù)提升。然而,當下國內(nèi)的算力服務(wù)市場存在的結(jié)構(gòu)性問題,使得推理計算成本始終居高不下,成為了制約AI應(yīng)用大規(guī)模落地的“隱形瓶頸”。
服務(wù)僵化,彈性不足:流量高峰時,GPU一卡難求,應(yīng)用卡頓,用戶流失;流量低谷時,預購的昂貴算力大量閑置,白白燒錢。剛性供給與彈性需求之間的矛盾,直接影響了AI應(yīng)用的效率和用戶體驗。
模式傳統(tǒng),阻礙增長:大多數(shù)廠商要求長租,高昂的固定投入讓創(chuàng)業(yè)公司望而卻步,也束縛了業(yè)務(wù)的快速迭代和試錯。
管理繁瑣 & 效率低下:跨平臺資源調(diào)度、復雜環(huán)境配置、持續(xù)運維投入……大量工程師的精力被基礎(chǔ)設(shè)施“綁架”,無法專注于模型創(chuàng)新。
供需錯配,一卡難求:算力資源建設(shè)粗放,精細化運營缺失,算力供需嚴重不匹配,一方面有大量閑置算力資源未能被有效利用,另一方面,短租高性能GPU卻“一卡難求”。
這些問題共同構(gòu)成了AI算力市場的“彈性、穩(wěn)定、低價”不可能三角。在現(xiàn)有模式下,企業(yè)往往只能在這三者中選擇其二,難以兼得。例如,追求極致彈性可能犧牲穩(wěn)定性或增加成本;追求穩(wěn)定和低價則可能失去彈性。這種困境成為AI開發(fā)者普遍面臨的巨大挑戰(zhàn)。
圖:多數(shù)云平臺提供的三類服務(wù):整租(低價&穩(wěn)定)、按量租(高價&穩(wěn)定)、搶占式SPOT實例(低價&彈性)
傳統(tǒng)GPU整租模式,其設(shè)計初衷更多是為了滿足持續(xù)、高負載的AI訓練任務(wù)。然而,AI推理的特點是請求量波動大、突發(fā)性強、單次請求耗時短。這種模式與AI推理的實際需求存在根本性的不匹配。當流量稀疏時,大量預購的GPU閑置,產(chǎn)生高昂的“空閑成本”;當流量激增時,又因擴容慢而導致用戶排隊或服務(wù)中斷。這使得AI應(yīng)用的成本居高不下,商業(yè)模式難以閉環(huán),從而阻礙了AI應(yīng)用的廣泛部署和創(chuàng)新。
圖:剛性供給與彈性需求之間的矛盾,直接影響了AI應(yīng)用成本和用戶體驗
Serverless GPU:重塑AI應(yīng)用部署范式
Serverless計算是一種云原生開發(fā)模型,它將底層服務(wù)器的管理和維護工作完全抽象化,由云服務(wù)提供商負責。開發(fā)者只需將代碼打包成容器或函數(shù),即可部署應(yīng)用。其核心優(yōu)勢在于:按需付費(閑置不收費)、自動伸縮(根據(jù)需求彈性擴縮容)、以及極大地簡化運維。
將GPU能力與Serverless模式結(jié)合,意味著AI開發(fā)者可以按需調(diào)用強大的GPU算力,無需預先購買和維護昂貴的硬件,也無需擔心資源閑置。特別適用于AI推理這種計算密集型、但請求量不穩(wěn)定的工作負載,能夠大幅縮短處理時間,優(yōu)化成本。這種模式也適用于實時和批量推理、3D渲染、大數(shù)據(jù)分析等典型用例。
圖:Serverless架構(gòu)工作機制示意圖
全球Serverless GPU市場正在蓬勃發(fā)展。在AI算力服務(wù)領(lǐng)域,國際上已有先行者,如RunPod,其Serverless產(chǎn)品提供了按小時計費、零出入網(wǎng)費、支持多種GPU型號、容器化部署、閃電般冷啟動等優(yōu)勢。主要服務(wù)于AI訓練和推理工作負載。
圖:Runpod.io
但同時,國內(nèi)卻缺少專注于Serverless GPU服務(wù)的云計算平臺,少數(shù)提供Serverless GPU服務(wù)的平臺往往資源極少(因為壓貨成本過高),難以實現(xiàn)快速穩(wěn)定的擴縮,使得多數(shù)本土應(yīng)用難以進行大批量的Serverless部署,制約了AI應(yīng)用的增長。
共績算力:專注Serverless GPU推理服務(wù)
在這一行業(yè)痛點日益凸顯之際,“共績算力”(suanli.cn)應(yīng)運而生。專注提供Serverless GPU推理服務(wù),打破行業(yè)“不可能三角”,實現(xiàn)真正的彈性&穩(wěn)定&低價,讓AI開發(fā)者不受算力制約,專注于產(chǎn)品本身,創(chuàng)造無限可能。
為支撐AI應(yīng)用的快速部署,共績算力平臺為AI推理服務(wù)部署打造了極簡流程,為AI開發(fā)者帶來了多重核心價值,真正實現(xiàn)以下特性:
極致彈性,隨時擴縮
隨流量自動擴縮容:流量激增時秒級擴容,流量回落時自動縮容歸零,告別浪費與排隊。
毫秒級按量計費:AI模型推理有請求才付費,沒請求不花錢,徹底告別空閑成本。
部署極簡,無縫遷移
Docker容器化:五步部署,一鍵托管,快速上云,實現(xiàn)真正“零運維”。
兼容各類平臺:提供預制鏡像與7x24h免費技術(shù)支持,可順滑遷移。
實測僅需5步,即可在2min內(nèi)從零啟動SD生圖服務(wù)
資源管飽,價格最優(yōu)
獨家調(diào)度網(wǎng)絡(luò):整合全國算力,提供萬卡資源。
保障充足低價:全網(wǎng)最實惠的算力(4090 單卡1.68元/h)。
支撐這一“彈性、穩(wěn)定、低價”算力服務(wù)的,是共績科技自研的閑時算力調(diào)度平臺。目前該平臺已經(jīng)調(diào)度整合了來自包括金山云、火山引擎在內(nèi)的26家智算平臺的算力資源,超越了單一云廠商的資源邊界,使得不可能三角變成可能,平臺不僅提供了Serverless的按需付費特性,更通過資源整合擴大了可用算力池,解決了“供需錯配”這一結(jié)構(gòu)性問題。
共績科技團隊擁有深厚的學術(shù)和技術(shù)背景,核心成員來自清華大學、北京大學以及 Intel、字節(jié)跳動、阿里等知名企業(yè)。 團隊在分布式資源調(diào)度領(lǐng)域深耕多年,目前已經(jīng)承建青海省、河北省省級算力調(diào)度平臺,具備極強的工程落地能力,Suanli.cn已累計服務(wù)90余家人工智能企業(yè)。曾獲 2024 年互聯(lián)網(wǎng)+大賽亞軍(金獎,創(chuàng)業(yè)組冠軍),并已獲得奇績創(chuàng)壇、水木創(chuàng)投等知名機構(gòu)的投資。
全網(wǎng)低價,助力AI創(chuàng)新
共績云AI推理Serverless平臺上線優(yōu)惠活動
NVIDIA RTX 4090 單卡推理,價格最高1.68元/小時!
即日起至6月18日,新用戶注冊并首次充值,額外贈送20%積分!
邀請好友,通過您的邀請碼成功拉新,您和被邀請人各得50元積分!
參與方式:活動期間,通過共績科技官方網(wǎng)站登錄用戶后臺,選擇在線充值即可自動參與并獲得贈送金額。具體活動細則以官網(wǎng)屆時公布為準。
立即訪問suanli.cn,開啟您的AI推理新紀元,讓算力不再是您創(chuàng)新的瓶頸!
相關(guān)文章
- 超擎擎天系列AI訓推一體服務(wù)器、鋒銳系列AI推理服務(wù)器:DeepSeek私有化部署的極簡方案
- 從智能優(yōu)化到全棧架構(gòu):超云AI推理算力技術(shù)實力解析
- 神州鯤泰打造昇騰能力中心,攜手伙伴共贏AI推理新機遇
- Neousys宸曜科技強固型Jetson AGX Orin邊緣計算平臺,賦能視覺邊緣計算AI推理應(yīng)用
- NVIDIA擴大AI推理性能領(lǐng)先優(yōu)勢,GH200 超級芯片在MLPerf一騎絕塵
- AI推理服務(wù)平臺升級,阿里云機器學習PAI推出新規(guī)格
- NVIDIA兩款全新GPU首秀:刷新AI推理紀錄、性能314倍于CPU
- 用光速跑云端AI推理 美國公司推光子芯片,商業(yè)產(chǎn)品明年見
- 阿里AI研究成果入選國際頂會ICML 2020,AI推理速度提升3倍
- 高通推出AI推理加速器“Cloud AI 100”系列 2020年將高速AI帶至云端
- 吉尼斯世界紀錄?AMD攜賽靈思宣布了一項新的AI推理世界紀錄
- 專為AI推理而生的英偉達Tesla T4芯片
- 英偉達GPU推進阿里巴巴業(yè)務(wù)突破 為AI推理應(yīng)用強勢賦能
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
- 中國移動將支持eSIM全系產(chǎn)品,釋放成長新動能
- 晟聯(lián)科:以高速互連接口IP方案賦能Scale-up 生態(tài)
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案