精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

天數(shù)智芯完成階躍星辰開源多模態(tài)大模型適配,共筑AI開源新生態(tài)

2025-02-19 13:12:03AI云資訊9401

2025 年 2 月 18 日,頭部大模型創(chuàng)業(yè)公司階躍星辰宣布開源兩款 Step 系列多模態(tài)模型 ——Step-Video-T2V 視頻生成模型和 Step-Audio 語音交互模型,引發(fā)行業(yè)高度關(guān)注。目前,兩款模型都可以在躍問 App 內(nèi)體驗(yàn)。天數(shù)智芯作為通用 GPU提供商,已第一時(shí)間攜手合作伙伴,完成對(duì)階躍兩款開源模型的適配。

階躍Step-Video-T2V 模型的參數(shù)量達(dá)到 300 億,可以直接生成 204 幀、540P 分辨率的高質(zhì)量視頻,這意味著能確保生成的視頻內(nèi)容具有極高的信息密度和強(qiáng)大的一致性。在階躍發(fā)布并開源了針對(duì)文生視頻質(zhì)量評(píng)測(cè)的新基準(zhǔn)數(shù)據(jù)集 Step-Video-T2V-Eval上的測(cè)評(píng)結(jié)果顯示,Step-Video-T2V 的模型性能在指令遵循、運(yùn)動(dòng)平滑性、物理合理性、美感度等方面的表現(xiàn)均顯著超過市面上既有的效果最佳的開源視頻模型。

Step-Audio 是行業(yè)內(nèi)首個(gè)產(chǎn)品級(jí)的開源語音交互模型,能夠根據(jù)不同的場(chǎng)景需求生成情緒、方言、語種、歌聲和個(gè)性化風(fēng)格的表達(dá),能和用戶自然地進(jìn)行高質(zhì)量對(duì)話。模型生成的語音具有自然流暢、情商高等特征,同時(shí)也能支持不同角色的音色克隆,滿足影視娛樂、社交、游戲等行業(yè)場(chǎng)景下的應(yīng)用需求。

在 LlaMA Question、Web Questions 等 5 大主流公開測(cè)試集中,Step-Audio 模型性能均超過了行業(yè)內(nèi)同類型開源模型,位列第一。Step-Audio 在 HSK-6(漢語水平考試六級(jí))評(píng)測(cè)中的表現(xiàn)尤為突出,是最懂中國(guó)話的開源語音交互大模型。比如下面這段對(duì)話中,模型能夠深入理解中文的博大精深,而不會(huì)被「繞暈」。

此次,為支持階躍星辰開源多模態(tài)大模型,天數(shù)智芯迅速調(diào)配資源展開模型適配工作。通過優(yōu)化 GPU 架構(gòu)和算法,天數(shù)智芯確保了模型在運(yùn)行過程中的穩(wěn)定性和高效性,讓 Step-Video-T2V 和 Step-Audio 的性能得以充分發(fā)揮,為用戶帶來流暢的體驗(yàn)。

天數(shù)智芯與階躍星辰的攜手合作,不僅為雙方在 AI 領(lǐng)域的發(fā)展注入了新動(dòng)力,也為 AI 產(chǎn)業(yè)開源技術(shù)生態(tài)的繁榮添磚加瓦,有望推動(dòng) AI 技術(shù)在更多行業(yè)落地生根,創(chuàng)造更大的社會(huì)價(jià)值。

相關(guān)文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術(shù)

更多>>
AI云資訊(愛云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺(tái)。
合作QQ:1211461360微信號(hào):icloudnews