小米小愛同學(xué) 5.0 發(fā)布,雷軍詳解「背后的人工智能」
2020-11-25 11:25:25AI云資訊1659
小米集團(tuán)副總裁、集團(tuán)技術(shù)委員會(huì)主席崔寶秋此前表示,小愛同學(xué)將從過去的語音助手升級(jí)為智能生活助手。
今日上午,小米創(chuàng)辦人,董事長兼 CEO 雷軍發(fā)文表示,小愛同學(xué)激活的設(shè)備數(shù)已經(jīng)達(dá)到達(dá) 2.28 億,月活已經(jīng)達(dá)到 7840 萬,累計(jì)喚醒 617 億次,“小愛同學(xué)也成為目前行業(yè)內(nèi)唯一一個(gè)擁有大規(guī)模落地場景的語音助手”。
以下為《雷軍:小愛同學(xué) 5.0 背后的人工智能》全文:
在月初舉辦的 MIDC 開發(fā)者大會(huì)上,我們發(fā)布了最新一代的小愛同學(xué)——小愛同學(xué) 5.0。全新的小愛同學(xué)帶來了五大升級(jí),覆蓋了囊括影音娛樂、生活服務(wù)、信息查詢、出行路況等 8 大領(lǐng)域 1400 + 技能,成為大家生活中離不開的智能生活助手。
從 2017 年 3 月 21 日,“小愛同學(xué)”第一次與大家見面,到現(xiàn)在僅僅 4 年時(shí)間,小愛同學(xué)激活的設(shè)備數(shù)已經(jīng)達(dá)到達(dá) 2.28 億,月活已經(jīng)達(dá)到 7840 萬,累計(jì)喚醒 617 億次,小愛同學(xué)也成為目前行業(yè)內(nèi)唯一一個(gè)擁有大規(guī)模落地場景的語音助手。
新一代小愛同學(xué) 全新五大升級(jí)
新一代小愛同學(xué)的 5 大升級(jí)包括:全場景智能協(xié)同、對(duì)話式主動(dòng)智能、定制化情感聲音、多模態(tài)融合交互和智慧學(xué)習(xí)好助手。
小愛同學(xué) 5.0 全場景智能協(xié)同
目前,擁有 5 件及以上連接小米 AIoT 平臺(tái)的設(shè)備用戶已達(dá) 560 萬。隨著用戶家中的智能設(shè)備越來越多,使用和操作也變得更加復(fù)雜。全場景智能協(xié)同就是讓小愛同學(xué) 5.0 成為控制家中眾多 IoT 設(shè)備的大腦,當(dāng)你發(fā)出一條需求指令時(shí),小愛同學(xué)會(huì)進(jìn)行統(tǒng)一決策,家中多個(gè)設(shè)備進(jìn)行協(xié)同配合,達(dá)到 “再多設(shè)備,都能化繁為簡”的效果,是當(dāng)之無愧的 “智能生活助手”。
想要達(dá)到智能協(xié)同,這其中需要解決的問題非常復(fù)雜。不僅要根據(jù)設(shè)備距離、活躍狀態(tài)、形態(tài)等綜合條件判斷,自主選擇出設(shè)備能力最能滿足當(dāng)前語義需求的設(shè)備,甚至還需要預(yù)測(cè)用戶潛在的設(shè)備控制需求,適時(shí)主動(dòng)的作出提醒和建議。
截止 2020 年 6 月,使用協(xié)同喚醒的總用戶數(shù)已達(dá) 94.4 萬,同時(shí)喚醒的攔截次數(shù)已達(dá) 9.4 億。
小愛同學(xué) 5.0 對(duì)話式主動(dòng)智能
有別于傳統(tǒng)移動(dòng)互聯(lián)網(wǎng) APP 或信息流被動(dòng)猜測(cè)用戶的形式,對(duì)話式主動(dòng)智能產(chǎn)品形態(tài)是小愛同學(xué)以自己的方式和節(jié)奏與用戶互動(dòng)溝通,像人一樣發(fā)起問題來增進(jìn)對(duì)用戶的了解。
主動(dòng)對(duì)話本身就是高級(jí)智能的體現(xiàn),它意味著人工智能不僅僅存在于與用戶互動(dòng)的短暫過程中,而是在更長的時(shí)間內(nèi)不斷的進(jìn)行思考和計(jì)算,需要像人一樣,擁有 “記憶”。
小愛同學(xué) 5.0 通過強(qiáng)大的自然語言處理技術(shù),主動(dòng)學(xué)習(xí)其中關(guān)于用戶的知識(shí),從而建立記憶。這有賴于小米自然語言處理技術(shù)(MiNLP)的深厚積累,MiNLP 目前已迭代到 3.0 版本,支持 30 多個(gè)業(yè)務(wù)場景,日調(diào)用次數(shù)達(dá) 80 億。
在記憶的存儲(chǔ)方面,小愛同學(xué)云端大腦會(huì)為用戶建立多維度的個(gè)人畫像,實(shí)現(xiàn)全設(shè)備個(gè)人信息互聯(lián)互通。小愛同學(xué)的所有功能,會(huì)對(duì)內(nèi)共享這些關(guān)于用戶的 “記憶”,每次交互結(jié)合個(gè)人畫像進(jìn)行計(jì)算,產(chǎn)生出面向用戶個(gè)人的個(gè)性化結(jié)果。
小愛同學(xué) 5.0 定制化情感聲音
為了滿足用戶提出的,可以跨越地理、時(shí)間阻礙,隨時(shí)隨地就可以得到陪伴感的 “情感訴求”,小愛同學(xué)定制聲音項(xiàng)目應(yīng)運(yùn)而生。
定制化情感聲音的實(shí)現(xiàn),不是僅依靠常規(guī)聲音處理技術(shù)就可以做到的。首先需要能夠?qū)τ脩粢纛l數(shù)據(jù)進(jìn)行預(yù)處理。然后是提取關(guān)鍵聲學(xué)特征,區(qū)別不同音色在頻譜上的表現(xiàn)。最后是通過定制合成音庫訓(xùn)練的基礎(chǔ)模型,進(jìn)行自適應(yīng)學(xué)習(xí),最終才能可實(shí)現(xiàn)只需少量的用戶錄音,就能取得很好的合成效果。
除了定制聲音功能以外,小愛同學(xué) 5.0 針對(duì)粵語也進(jìn)行了深度的優(yōu)化,并在 8 月份開啟了粵語在音箱上的內(nèi)測(cè)。本月中旬,我們已正式啟動(dòng)在手機(jī)及電視上小愛同學(xué)粵語功能的內(nèi)測(cè),預(yù)計(jì)在月內(nèi),小愛同學(xué)粵語功能將陸續(xù)開放到所有音箱上。
小愛同學(xué) 5.0 智慧學(xué)習(xí)好助手
小愛同學(xué) 5.0 將學(xué)習(xí)作為一個(gè)重要的升級(jí)模塊,整合了海量的優(yōu)質(zhì)的 K12 網(wǎng)課資源,精選 1000 + 網(wǎng)課視頻資源,與讀書郎、義方教育等 35 家優(yōu)質(zhì)資源方達(dá)成了合作,并拉通了電視 / 音箱 / 手機(jī)教育會(huì)員同步。
課程表是學(xué)生學(xué)習(xí)中最基本的一個(gè)工具類需求。我們把課程表與小愛同學(xué)結(jié)合在一起,打造了一個(gè)擁有國內(nèi)首發(fā) AI 拍照導(dǎo)入課程功能等先進(jìn)人工智能技術(shù)加持的 AI 課程表。
另外一大工具,就是翻譯。為了讓翻譯更高效、更精準(zhǔn),小愛同學(xué)團(tuán)隊(duì)在文本前處理模塊進(jìn)行了優(yōu)化,包括基于語言規(guī)則和模型的文本順滑技術(shù)、融合上文內(nèi)容的實(shí)時(shí)文本糾錯(cuò)算法、基于多語言預(yù)訓(xùn)練模型的實(shí)時(shí)語義斷句算法等。
小愛同學(xué) 5.0 多模態(tài)融合交互
為了讓小愛同學(xué)與用戶之間進(jìn)行更自然的溝通,我們做了更智能的多模態(tài)融合交互,可以通過聲音、肢體語言、信息載體(文字、圖片、音頻、視頻)、環(huán)境等多種方式與智能設(shè)備進(jìn)行交流。打破了傳統(tǒng) PC 式的鍵盤輸入和智能手機(jī)的點(diǎn)觸式交互,定義了下一代智能產(chǎn)品和人的專屬交互模式。
新一代小愛同學(xué)背后 是小米 AI 能力的長期積累
小米集團(tuán)擁有非常豐富的業(yè)務(wù)線,包含了硬件產(chǎn)品、電商和新零售以及互聯(lián)網(wǎng)業(yè)務(wù)。小米的人工智能不僅僅體現(xiàn)在小愛同學(xué)上,還擁有非常廣泛的應(yīng)用領(lǐng)域,比如計(jì)算機(jī)視覺技術(shù)、計(jì)算機(jī)語音技術(shù)和機(jī)器學(xué)習(xí)技術(shù)等。
經(jīng)過這幾年的努力,我們的 AI 已經(jīng)建立了比較完整的能力圖譜和小米的 AI 能力平臺(tái),在此基礎(chǔ)上打造了小米的相關(guān)應(yīng)用,包括智能相機(jī)、小愛同學(xué)、機(jī)器翻譯等等。強(qiáng)大的智能硬件生態(tài)為 AI 能力的快速提升建立了基礎(chǔ),同時(shí) AI 能力又反過來,全面賦能了小米各個(gè)業(yè)務(wù)線。
比如在計(jì)算機(jī)視覺技術(shù)方面,我們做了大量的工作,包括超級(jí)分辨率、文檔模式 / OCR、魔法換天、魔法分身等。今年,我們的 HDR(高動(dòng)態(tài)范圍拍照)也助力小米 10 Pro / 至尊紀(jì)念版相機(jī)成功獲得 DXOMARK 評(píng)測(cè)世界第一。
我們?cè)谟?jì)算機(jī)語音、機(jī)器學(xué)習(xí)等很多方面也都做了大量的工作,整個(gè)集團(tuán)在人工智能領(lǐng)域的投入,可能遠(yuǎn)遠(yuǎn)超過大家的想象。截止 2019 年 12 月 31 日,小米集團(tuán)共提交專利申請(qǐng) 33000 余件,其中 AI 領(lǐng)域?qū)@暾?qǐng)數(shù)量已進(jìn)入全球互聯(lián)網(wǎng)企業(yè)第一陣營。包括端到端語音識(shí)別、就近喚醒、分布式放音、離線翻譯等在內(nèi)的多項(xiàng)技術(shù)處于行業(yè)一流水平。
同時(shí),我們也在積極引入全球頂尖的研發(fā)人才,比如我們成功邀請(qǐng)到了人工智能領(lǐng)域的頂尖專家 Daniel Povey 加入小米。
未來,小米的人工智能會(huì)進(jìn)一步打造核心技術(shù),推進(jìn)各項(xiàng) AI 技術(shù)的業(yè)務(wù)落地,給用戶打造更好的體驗(yàn)。同時(shí),也會(huì)更加的開放,繼續(xù)加強(qiáng)和高等院??蒲性杭捌淦髽I(yè)的合作,將更多更好的 AI 技術(shù)開放給社會(huì),為每一個(gè)人帶來更美好的和智能的生活。
相關(guān)文章
- 共聚 ChinaJoy!Moloco與小米國際互聯(lián)網(wǎng)業(yè)務(wù)部攜手共話全球增長新機(jī)遇
- 小米AI眼鏡×商湯日日新,打造隨身的AI入口
- 創(chuàng)米數(shù)聯(lián)推出車配4K云臺(tái)攝像頭等新品,適配小米YU7智能聯(lián)動(dòng)場景
- 持續(xù)強(qiáng)化全員安全隱私能力 小米第六屆安全與隱私宣傳月圓滿落幕
- 魯大師2025年手機(jī)半年報(bào):ColorOS蟬聯(lián)流暢霸主,小米玄戒殺入性能前五
- 小米入場,AI眼鏡市場迎來真正拐點(diǎn)
- 小米玄戒O2芯片或因需通過復(fù)雜的車載多平臺(tái)設(shè)備通信驗(yàn)證而延遲上市
- 小米AI眼鏡攜手明月鏡片,發(fā)布下一個(gè)時(shí)代的智能設(shè)備
- 小米發(fā)布首款搭載自研玄戒O1芯片平板Pad 7S Pro:支持120W快充、電池容量達(dá)10610mAh
- 預(yù)熱開啟!小米MIX Flip 2即將來襲,暑期換機(jī)得看聯(lián)想moto 滿分小折疊
- 小米MIX Flip 2即將發(fā)布,配置向直板旗艦看齊!但最強(qiáng)對(duì)手竟是聯(lián)想moto
- AI引發(fā)兒童康復(fù)范式變革 大米和小米宣布旗下AI系統(tǒng)向全國機(jī)構(gòu)開放
- 高通攜手上海電信、久事旅游和小米,在黃浦江游輪實(shí)現(xiàn)萬兆網(wǎng)絡(luò)覆蓋與沉浸式體驗(yàn)的里程碑
- 高通攜手上海電信、久事旅游和小米,在黃浦江游輪實(shí)現(xiàn)下行峰值速率突破8.4Gbps里程碑
- 丹尼克爾完成億元融資,小米&鐘鼎聯(lián)合注資加碼智能裝配賽道
- 魯大師5月新機(jī)性能/流暢/AI榜:紅魔再刷性能上限,小米玄戒首秀驚艷,OV上演流暢優(yōu)化對(duì)決
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動(dòng),助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎(jiǎng)”,以芯片級(jí)創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時(shí)延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢(shì)科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個(gè)孩子提供專屬學(xué)習(xí)方案