聲網(wǎng)發(fā)布Linux Server SDK 支持大模型Python與Go語言
2024-07-29 12:23:58AI云資訊1208
AIGC 和 大語言模型 LLM 的快速發(fā)展正推動人工智能領域的進步和創(chuàng)新,LLM 作為 AIGC 的核心模塊,其發(fā)展尤為引人注目。隨著技術的不斷進步,大語言模型的能力也不斷進化,一方面,訓練數(shù)據(jù)量與算力的提升,AI 的生成內(nèi)容更精準、更智能;另一方面,大模型的交互方式,也從文本升級為音頻、視頻的多模態(tài),可以支持人與AI的語音對話等。
在多模態(tài)大模型的趨勢下,RTC成為了人與AI交互中的重要一環(huán),越來越多的企業(yè)與開發(fā)者紛紛探索在大語言模型或者AI應用場景中快速集成高效的音視頻能力,構(gòu)建AI陪聊、AI口語老師等一系列場景。
對此,聲網(wǎng)推出Linux Server SDK,支持當下大模型編程最主流的兩類語言Python與Go,企業(yè)可基于聲網(wǎng)Linux SDK,快速接入大模型,上線具備RTC傳輸能力的AI應用場景,如AI語音助手、AI口語老師、虛擬戀人、多人語音游戲等。
聲網(wǎng)Linux Server SDK以API的形式提供了一系列的功能,例如Linux Server SDK for Go可支持連接管理、信令發(fā)送、音頻訂閱與推送、事件回調(diào)通知等,其中信令傳輸能力不僅可應用于創(chuàng)建DataStream數(shù)據(jù)流,并發(fā)送信令,也能應用在大模型中發(fā)送數(shù)據(jù)流消息,例如將TTS、STT和LLM的結(jié)果發(fā)送給客戶端。
此外,Linux Server SDK還提供了使用時序的教程,從建立連接、訂閱遠端用戶的音頻、獲取遠端用戶的音頻數(shù)據(jù)、推送音頻數(shù)據(jù)、發(fā)送文字信令、斷開連接等不同流程的詳細描述,幫助開發(fā)者快速上手。
聲網(wǎng)LinuxServer SDK客戶集成實踐圖
憑借在RTC行業(yè)日積月累的深耕細作,聲網(wǎng)Linux Server SDK在RTC的低延時、抗弱網(wǎng)、跨國傳輸、并發(fā)等方面具備優(yōu)秀的性能。
·低延時與全球部署:聲網(wǎng)自研的SD-RTN?實時傳輸網(wǎng)絡覆蓋了全球200多個國家與地區(qū),音視頻的全球端到端延遲平均達到200ms。聲網(wǎng)還通過優(yōu)化網(wǎng)絡傳輸協(xié)議和算法,進一步降低音視頻傳輸?shù)难舆t。
·智能路由與抗弱網(wǎng):針對網(wǎng)絡環(huán)境的波動,聲網(wǎng)的智能路由技術能夠根據(jù)用戶的網(wǎng)絡狀況自動選擇最優(yōu)的網(wǎng)絡路徑,確保通話的穩(wěn)定性和流暢性。聲網(wǎng)的抗弱網(wǎng)傳輸與抗丟包算法,結(jié)合網(wǎng)絡探測、抗丟包技術、自適應jitter buffer、網(wǎng)絡擁塞控制策略等,為用戶在各種網(wǎng)絡環(huán)境下提供流暢的互動體驗。
·30000+終端機型適配:由于不同的設備可能對于語音處理效果產(chǎn)生影響,聲網(wǎng)的RTC SDK支持30000+終端機型適配,中低端機型覆蓋廣,幫助大模型與客戶解決了多設備兼容性的后顧之憂。
·并發(fā)性能:客戶集成聲網(wǎng)Linux Server SDK后可支持上百路的音視頻并發(fā)。
·支持多頻道多路流:聲網(wǎng)SDK支持用戶同時加入多個頻道,同一時間可以在多個頻道中接收和發(fā)布音視頻流。
目前聲網(wǎng)Linux Server SDK為Alpha版。相關文章
- 聲網(wǎng)對話式AI引擎已接入DeepSeek-V3.1
- 聲網(wǎng) Native RTC SDK 4.6.0上線 視頻互動體驗全方位提升
- 聲網(wǎng)將參展2025 WAIC 全新對話式AI引擎即將亮相
- 聲網(wǎng)上線全球首個 AI 模型評測平臺(對話式) 提供級聯(lián) ASR+LLM+TTS 橫向測評
- 聲網(wǎng)攜對話式AI引擎亮相第30屆上海電視節(jié)
- 聲網(wǎng)攜手珞博智能,共同打造AI陪伴硬件新體驗
- MiniMax、星野、智譜清言,這些 AI 應用都在用聲網(wǎng)打造對話式 AI 體驗
- 聲網(wǎng)入選2025AIGC廠商全景報告5大板塊,對話式AI實力再獲認可
- 聲網(wǎng)母公司Q1財報:營收增長12.1% 連續(xù)兩季度GAAP盈利
- 聲網(wǎng)蟬聯(lián)PAGC金帆獎優(yōu)秀出海產(chǎn)品技術服務獎項
- 聲網(wǎng)入選AIGC應用全景圖譜、AI大模型產(chǎn)業(yè)圖譜
- 聲網(wǎng)對話式 AI 引擎接入智譜GLM模型,支持獲取智能體短期記憶
- 聲網(wǎng)對話式AI引擎摘得微軟開發(fā)者挑戰(zhàn)賽“最具商業(yè)價值獎”
- 2025年值得關注的AIGC產(chǎn)品 聲網(wǎng)對話式AI引擎上榜
- 聲網(wǎng)攜手商湯,共拓實時音視頻AI應用新邊界
- 商湯日日新上線聲網(wǎng)云市場,與四十家企業(yè)開啟合作
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案