阿里云通義智能語音技術(shù)助力聽力熊打造領(lǐng)先的AI智能終端——用大模型陪伴青少年學(xué)習(xí)成長|看見新力量NO.139
2024-11-15 15:47:48AI云資訊18518
在層出不窮的AI硬件爆發(fā)的當(dāng)下,智能教育硬件市場也迎來新的機遇,經(jīng)歷了一系列從功能創(chuàng)新、內(nèi)容更新到用戶需求挖掘的變革。
隨著市場加速“內(nèi)卷”,大而全的學(xué)習(xí)機、復(fù)讀機類產(chǎn)品越來越多,市場規(guī)模增速趨緩的同時,更多細分場景也在被逐漸發(fā)掘。從傳統(tǒng)的復(fù)讀機,到AI時代的“聽力機”,有這樣一家企業(yè),探索出了一種新的品類,定義了一種新的需求,在青少年智能終端賽道,取得了“第一”的地位。 作為智能聽力機品類的開創(chuàng)者與領(lǐng)導(dǎo)品牌,聽力熊擁有豐富的產(chǎn)品線,包括智能聽力機、閱讀本和單詞寶等。
其中,新一代聽力機“聽力熊”T6,搭載了聽力熊自研的TeeniGPT——這是全球首款面向青少年的通用大模型應(yīng)用,該模型具備語音交互、語音生成和語義理解等功能,為青少年用戶帶來更有趣的智能體驗。
僅兩年時間,聽力熊已經(jīng)成為了聽力機品類頭部企業(yè),打造出一個以AI技術(shù)為核心,線上線下全渠道覆蓋的新科技品牌。 目前,聽力熊的用戶累計已超100萬,且聽力熊的AI大模型應(yīng)用日均請求達100萬次,日均tokens消耗達10億,在青少年群體中廣受喜愛。
在聽力熊業(yè)務(wù)快速增長的過程中,阿里云為聽力熊提供了高性價比的算力與云服務(wù)解決方案,助其降低了運營成本,并基于通義實驗室智能語音交互產(chǎn)品和生成式語音大模型CosyVoice的能力,提供低延遲的語音互動、個性化聲音的復(fù)刻以及生成豐富海量的有聲書,讓學(xué)生的熏聽更加有趣有料,這些技術(shù)提升了聽力熊的智能化水平和青少年用戶體驗,加速了其產(chǎn)品化進程,推動了面向青少年的專屬大模型迭代。
本期「看見新力量」欄目與聽力熊創(chuàng)始人兼CEO夏崇彥進行對話,一起探討關(guān)于AI硬件在青少年教育上的創(chuàng)新和洞見。
01:挖掘教育硬件細分場景,開創(chuàng)“聽力機”智能化新物種
2021年,聽力熊創(chuàng)立之初,團隊將其目標(biāo)定位為面向未來的、青少年專屬的便攜式AI終端,并以AI能力和創(chuàng)新的交互體驗作為切入點,推出了AI聽力機產(chǎn)品。2022年,聽力熊堅持為青少年提供正版的優(yōu)質(zhì)內(nèi)容,與新東方、喜馬拉雅等內(nèi)容平臺展開合作,讓更多好內(nèi)容在產(chǎn)品中落地。2023年8月,聽力熊推出青少年通用大模型應(yīng)用“TeeniGPT”。在其助力下,聽力熊T6率先實現(xiàn)了中、英文雙語不同場景下的深度應(yīng)用。
談及對目標(biāo)用戶的洞察,夏崇彥講述創(chuàng)業(yè)過程中的一段摸索。2015-2017年,團隊將多模態(tài)AI交互技術(shù)在全年齡段全場景進行了測試。用戶數(shù)據(jù)結(jié)果顯示,青少年群體對于新技術(shù)以及新交互體驗的包容性遠遠高于成年人:出于對效率的要求,成年人對尚不完善的AI技術(shù)的包容度很低,但對于青少年群體,一個足夠有趣的交互體驗就能打動他們,他們也對AI技術(shù)有著更大的好奇心。看到這個機遇的夏崇彥,立即展開了產(chǎn)品化的探索。
夏崇彥認為,對于成長于技術(shù)爆發(fā)時期的“AI原生一代”,一款青少年專屬的大模型終端是不可或缺的。青少年群體如何利用其碎片化時間成為了夏崇彥團隊的關(guān)注點,他們從便攜性、安全健康的封閉生態(tài)需求出發(fā),為聽力熊的首款產(chǎn)品找到了最適宜的出發(fā)點——復(fù)讀機,并利用AI技術(shù)和創(chuàng)新產(chǎn)品體驗將其升級為“智能聽力機”。聽力機巧妙規(guī)避了傳統(tǒng)電子屏幕“傷眼”的弊端,操作簡單、易于攜帶,青少年用戶的反饋良好加上專業(yè)化的內(nèi)容體系,很快也取得了家長們的信任。
作為一款教育硬件產(chǎn)品,聽力機搭載的內(nèi)容質(zhì)量,是決定產(chǎn)品體驗的重中之重。夏崇彥指出,傳統(tǒng)復(fù)讀機市場無法做到持續(xù)的破圈和高速增長,很大一部分原因是盜版內(nèi)容的泛濫。團隊深知這無法撐起一個品牌長期發(fā)展的基礎(chǔ),于是在創(chuàng)業(yè)初期,就十分重視與優(yōu)質(zhì)內(nèi)容供給方的合作。除了喜馬拉雅、口袋故事等內(nèi)容平臺,團隊也將橄欖枝伸向了廣大出版機構(gòu)——不僅讓廣大用戶接觸到了高質(zhì)量的紙質(zhì)出版物,傳統(tǒng)出版機構(gòu)也可以以聽力熊為渠道,擴大內(nèi)容的流量與覆蓋面,形成了雙贏的局面。
在智能化方面,公司高度重視對AI的應(yīng)用,基于和阿里云長期以來的合作基礎(chǔ)和信任,在對比了多家模型的效果后,聽力熊選擇了通義團隊研發(fā)的技術(shù)產(chǎn)品,從語音識別、語音合成、LLM模型到語音翻譯,并將這些底層技術(shù)融入了產(chǎn)品的方方面面,持續(xù)改善用戶體驗,使產(chǎn)品使用更加流暢,也積累了大量的實踐成果。
得益于對用戶的使用理解和場景挖掘,聽力熊在市場上取得了積極的用戶反饋。在暑假期間,聽力機上線了一項AI角色互動功能,雖然沒有進行大范圍推廣,但在青少年用戶們自發(fā)的探索下,仍然實現(xiàn)了30%的首日打開率。在那一個月,聽力機的調(diào)用量激增40倍,日均調(diào)用量達10億tokens。截至目前,聽力熊的用戶規(guī)模已經(jīng)超過一百萬,青少年日均使用時長超3小時,遠超市面上的同類產(chǎn)品。
02:牽手通義智能語音,加速商業(yè)化與產(chǎn)品化進程
過去幾年,由于電商領(lǐng)域的激烈競爭與流量格局的變化,也給聽力熊銷售的穩(wěn)定性帶來了挑戰(zhàn),“雙減”政策的出臺,更增添了外部環(huán)境的壓力。在復(fù)雜的市場環(huán)境下,聽力熊的商業(yè)化進程依然在行業(yè)中“一馬當(dāng)先”。在這方面,夏崇彥也分享了團隊的經(jīng)驗:“我覺得一個創(chuàng)業(yè)公司,我們需要追求商業(yè)化和技術(shù)的平衡成長。因為在我過去的創(chuàng)業(yè)過程中,往往單純追求技術(shù)領(lǐng)先。很多產(chǎn)品和功能其實不一定能獲得市場的認可,商業(yè)化是一個必須要面對的現(xiàn)實的問題。”
夏崇彥提出,團隊在研發(fā)產(chǎn)品的初期,就聚焦于技術(shù)如何改善產(chǎn)品體驗,如何與用戶的需求場景相結(jié)合,這也是公司在商業(yè)化過程中考慮的重點。
AI大模型及云產(chǎn)品的技術(shù)能力與效率,關(guān)乎著聽力熊絕大多數(shù)的產(chǎn)品體驗。早期,聽力熊通過購買英偉達A100算力卡,部署并微調(diào)開源模型的形式,實現(xiàn)對成本和效果的兼顧,但隨著用戶增長高頻使用帶來的成本增加,使得運營難以持續(xù)。在公司產(chǎn)品接入阿里云后,阿里云為聽力熊提供了更高性價比的解決方案,特別是今年,阿里云多項云產(chǎn)品和AI產(chǎn)品及算力等成本大幅下降,使得團隊的產(chǎn)品化進程及效率進一步加快。
此外,阿里云在云服務(wù)和AI領(lǐng)域具備強大的性能與豐富的經(jīng)驗,聽力熊的核心產(chǎn)品背后,包括在線音頻、云存儲與CDN等,均在阿里云進行部署和運營;而在模型能力方面,通義的語音語義識別、分析理解以及合成語音等場景下,均表現(xiàn)了出色的性能,實現(xiàn)了高水平的準(zhǔn)確度、擬人化與流暢度。
相較于傳統(tǒng)小模型的語音合成,通義CosyVoice大模型語音合成能夠根據(jù)它對上下文的理解,洞悉文本中隱含的情緒以及角色身份等信息,從而給出更有表現(xiàn)力和自然韻律的表達。在CosyVoice中,語義和韻律部分使用大模型進行建模,并且在海量的多門語言、多樣情感數(shù)據(jù)上進行訓(xùn)練,形成生成式語音大模型的基座,使得CosyVoice具備很強的遷移能力,即使原聲僅有1-3句話,也能復(fù)刻這個音色,這個易用好玩的功能在聽力熊上一經(jīng)上線,就受到了青少年用戶的熱情試用。
“阿里云是一家能夠給我們安全感的云服務(wù)廠家,不管是技術(shù)實力,還是產(chǎn)品穩(wěn)定性,還有服務(wù)響應(yīng)的及時性,都能很好的滿足公司經(jīng)營與發(fā)展的需求”,夏崇彥如此評價。在AI模型面向青少年群體的解決方案調(diào)優(yōu)過程中,為了符合這一人群的認知能力和表達習(xí)慣,同時實現(xiàn)對不良內(nèi)容的過濾,聽力熊與通義技術(shù)團隊展開了深度的交流和合作,共同開發(fā)適宜于青少年的大模型,在這個過程中,阿里云和通義團隊為我們提供了非常好的解決方案與快速的響應(yīng)能力。
03:陪伴“一代人”成長,做好“一代人”的大模型終端
目前,聽力熊已在北京、深圳等城市設(shè)立公司業(yè)務(wù),未來公司也會計劃在杭州設(shè)立大模型應(yīng)用研發(fā)中心,圍繞AI大模型的應(yīng)用場景進行智能終端的研發(fā),不斷提升用戶的產(chǎn)品體驗與Agent的效能。
已經(jīng)擁有百萬用戶的聽力熊并不滿足于當(dāng)前的成就,而是將目光放在了更遠的未來,基于AI技術(shù)不斷地進步,致力于從學(xué)習(xí)到生活,從認知到自我實現(xiàn),全方位地服務(wù)于青少年成長過程中的各類需求。
聽力熊創(chuàng)始人兼CEO夏崇彥認為,在可以看得見的未來,AI終端的服務(wù)交付形式將發(fā)生變化,從“人找服務(wù)&設(shè)備”到“服務(wù)&設(shè)備找人”的轉(zhuǎn)變,從“理解用戶需求”到“提前解決用戶需求”,通過 AI + 終端應(yīng)用的創(chuàng)新模式,實現(xiàn)從基于用戶指令的傳統(tǒng)應(yīng)用到基于用戶潛在意圖主動服務(wù)的根本性轉(zhuǎn)變,徹底重塑跨端體驗。未來AI產(chǎn)品的服務(wù)會深入到用戶的需求和體驗,企業(yè)也需要為用戶持續(xù)提供更個性化的服務(wù),才可以更長久地獲得用戶的信任。
基于AI終端對青少年群體學(xué)習(xí)成長陪伴的長期主義理念,聽力熊致力于打造一代人的AI大模型終端設(shè)備,陪伴一代人的成長。通過提供長期的陪伴和個性化服務(wù),從教育學(xué)習(xí)場景逐步擴展到更多元的領(lǐng)域,實現(xiàn)品牌與用戶的共同成長。
超級應(yīng)用的背后,離不開強大的技術(shù)支持,AI時代對基礎(chǔ)設(shè)施的性能、效率提出了更高的要求。2024云棲大會現(xiàn)場展示了阿里云全系列產(chǎn)品家族面向AI的升級:最新上線的磐久AI服務(wù)器,并提供AI算法預(yù)測GPU故障,準(zhǔn)確率達92%;為AI設(shè)計的高性能網(wǎng)絡(luò)架構(gòu)HPN7.0,可穩(wěn)定連接超過10萬個GPU ,模型端到端訓(xùn)練性能提升10%以上;人工智能平臺PAI,已實現(xiàn)萬卡級別的訓(xùn)練推理一體化彈性調(diào)度,AI算力有效利用率超90%。在模型層,通義實驗室也持續(xù)飽和式投入,幾乎保持以月為周期迭代基礎(chǔ)模型。云棲大會現(xiàn)場阿里云宣布通義旗艦?zāi)P蚎wen-Max全方位升級,性能接近GPT-4o,同時還發(fā)布了開源模型Qwen2.5系列,成為僅次于美國Llama的世界級模型群。
同時,據(jù)IDC發(fā)布《中國人工智能公有云服務(wù)市場份額2023:大模型重塑云服務(wù)》報告中,阿里云智能語音公有云服務(wù)市場份額35.6%,排名第一。這是繼2019年后,阿里語音AI市場份額連續(xù)五年保持首位。
“作為青少年用戶學(xué)習(xí)交互的入口,未來很期待能夠與阿里云、通義實驗室更深入的合作,將AI技術(shù)與更廣泛的場景結(jié)合起來,更好地滿足青少年成長過程中的需求”,夏崇彥表示。
據(jù)測算,到2025年,我國的教育智能硬件市場規(guī)模將超過1000億元人民幣,廣闊的市場必將帶動學(xué)習(xí)機企業(yè)進行不斷地創(chuàng)新和迭代。同時伴隨著大模型推理及多模態(tài)能力的持續(xù)提升、端側(cè)AI的突破及算力成本的下降,將推動AI+智能終端空間進一步打開。聽力熊將會伴隨青少年在學(xué)習(xí)和成長的道路上,探索智能化的無限可能。
相關(guān)文章
- Soul全雙工語音大模型升級 迭代人機交互體驗感
- 模型選型專題系列 | 業(yè)界首個!元景MaaS平臺上線《大模型選型說明書》
- 獲央視點贊 深蘭科技AI醫(yī)療大模型落地打浦橋街道社區(qū)服務(wù)中心
- 新達內(nèi)與百度智能云達成戰(zhàn)略合作 聯(lián)合培養(yǎng)人工智能大模型人才
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案
- 打造廣東首個地方文獻專題處理AI大模型,南沙區(qū)圖書館“阿貝數(shù)字人”項目重磅上線!
- 商湯大裝置躋身中國大模型平臺市場頭部廠商,萬象平臺加速AI落地“最后一公里”
- DFRobot 亮相貿(mào)澤電子 elexcon 2025 展臺,展示與Qwen3 大模型融合的AI 應(yīng)用
- 曠視趙康:做大模型的“煉金術(shù)士”,讓AI在千行百業(yè)中兌現(xiàn)價值
- 云軸科技ZStack入選IDC大模型推理算力市場報告典型廠商
- 中國具身大模型初創(chuàng)公司眸深智能獲得IJCAI2025杰出論文獎,唯一獲獎大陸團隊!
- 心率血氧監(jiān)測新玩法:行空板M10融合AI大模型,讓數(shù)據(jù)會“說話”
- 特斯拉在中國市場放棄xAI的Grok大模型 選擇接入DeepSeek AI技術(shù)
- 昇騰助力中科大團隊實現(xiàn)MoE 稀疏大模型并行推理提速超30%
- 聚焦制造業(yè)智能化轉(zhuǎn)型 中國科學(xué)技術(shù)大學(xué)依托昇騰突破知識增強大模型關(guān)鍵技術(shù)
- 大模型推理成本居高不下,浪潮存儲幫你來突圍!
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案