未來幾年,誰能拯救手機拍照功能?
2019-02-06 08:14:51AI云資訊1127
手機拍照作為剛需功能,一直是用戶評判一款終端好壞的直接標(biāo)準(zhǔn)之一。受限于物理極限以及摩爾定律,攝像頭和傳感器實現(xiàn)“質(zhì)”的飛躍,可能性不大。未來幾年,手機攝影的突破點在于AI技術(shù)與元器件的深度融合。
近日,在商湯科技與艾瑞咨詢聯(lián)合發(fā)布的《2018年中國人工智能手機行業(yè)研究報告》中指出,2006年及以前,手機行業(yè)屬于功能推動階段,從一開始圍繞接打電話到承載拍照、聽音樂、上網(wǎng)等復(fù)合功能。2007年至2016年,市場變?yōu)樾阅芡苿与A段,配置成為商家逐鹿的方向。2017年之后,市場進(jìn)入智能驅(qū)動的階段。人工智能開始推動手機產(chǎn)品的迭代,硬件技術(shù)的升級需要軟件技術(shù)地優(yōu)化和凸顯。
人工智能手機=AI芯片+AI功能,即“滿足AI算力需求移動端芯片,且加載了深度學(xué)習(xí)AI功能的智能手機?!?。AI芯片指內(nèi)置獨立神經(jīng)網(wǎng)絡(luò)計算單元,通過CPU、GPU、DSP及其他通用計算單元聯(lián)動賦能。AI功能囊括人臉解鎖、AI拍照、智能相冊、AI智能助手等等。
報告顯示,巨頭廠商扮演了引領(lǐng)者的角色,多方面推動AI手機落地。2018年,我國4G滲透率達(dá)70%,手機市場3G向4G升級結(jié)構(gòu)性紅利漸失。部分硬件提升邊際成本和收益不成正比。這種情況下,預(yù)計到2022年,搭載AI功能的智型手機出貨量占比,將從2017年的不到10%提升到80%,年銷量將超13億部。AI手機將是未來行業(yè)的產(chǎn)品方向。
盡管在過去的2018年,AI人工智能手機噱頭滿滿,不乏各種炒作以及不著邊際地吹牛皮。但手機攝影取得的巨大進(jìn)步,主要在于軟件和硅層,而不是傳感器和鏡頭等硬件。AI人工智能可以更好地理解,圖像呈現(xiàn)的內(nèi)容。預(yù)計未來幾年關(guān)于手機攝影的常識,將會從硬件思維轉(zhuǎn)變?yōu)锳I思維。手機制造商們的人工智能技術(shù)水平,將會成為手機拍照功能好壞的主要判斷標(biāo)準(zhǔn),且這種趨勢絲毫沒有放緩的跡象。
2015年,谷歌上線的APP,清晰地展示了人工智能技術(shù)與攝影技術(shù)融合之后的照片。在此之前,谷歌一直試圖通過機器學(xué)習(xí)技術(shù)對照片進(jìn)行分類。谷歌的照片APP直接面向消費者提供人工智能服務(wù),這對于大多數(shù)人而言,是難以想象的?!巴蝗恢g,用戶可以從雜亂無章、數(shù)以千計的圖片庫,轉(zhuǎn)換為可搜索的資料庫”,“突然之間,谷歌就知道你的貓看起來像什么”。
據(jù)雷鋒網(wǎng)了解,2013年,谷歌收購了多倫多大學(xué)一家神經(jīng)網(wǎng)絡(luò)方面的初創(chuàng)公司DNNResearch,用以推動谷歌基于語音和圖片的搜索功能。該公司通過訓(xùn)練人類標(biāo)記的數(shù)據(jù),訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò),此過程被成為監(jiān)管學(xué)習(xí)(Supervised Learning)。具體而言,在數(shù)百萬張圖片上訓(xùn)練網(wǎng)絡(luò),以使得它能夠通過像素級別的視覺線索,來幫助圖片識別分類。隨著時間的推移,算法將會識別得越來越準(zhǔn)確。
比如,一個大熊貓,囊括了可以正確識別熊貓動物品類,黑色皮毛與白色皮毛的比例,以及和荷蘭奶牛皮毛的區(qū)別。進(jìn)一步訓(xùn)練以后,理解更加抽象的詞匯成為可能。例如,“動物”、“早餐”等,對人類而言比較簡單,但對機器來講,屬于沒有視覺輸出的詞匯。
訓(xùn)練完以上的模型,需要大量的時間以及整理能力。一旦數(shù)據(jù)中心完成之后,它將可以以低功耗、便捷的方式在設(shè)備上運行。如今,前期這些繁重的工作已經(jīng)完成,只要把照片上傳到云端,谷歌就可以通過模型來分類、標(biāo)記整個圖片庫。
谷歌圖片功能發(fā)布大約一年之后,蘋果發(fā)布了基于神經(jīng)網(wǎng)絡(luò)(類似谷歌)的搜索照片功能。但鑒于蘋果用戶隱私條例的承諾,蘋果的分類功能實際上是在每個設(shè)備中單獨進(jìn)行的,設(shè)置后在后臺進(jìn)行,并不發(fā)送數(shù)據(jù),用時長達(dá)一到兩天時間。
盡管和照片智慧管理是一回事,但人工智能和機器學(xué)習(xí),毫無疑問,對于照片拍攝具有重大意義。攝像頭和傳感器可以“比大更大”,可是又起到怎樣的作用呢?攝像頭、傳感器已經(jīng)達(dá)到物理極限。如今,在某些情況下,手機拍攝的照片比傳統(tǒng)照相機拍得更好已經(jīng)不是什么“稀罕事”。其背后深層次原因在于,傳統(tǒng)相機無法在芯片維度與手機競爭。手機芯片系統(tǒng)包括CPU、圖像信號處理器、越來越多的神經(jīng)處理單元NPU。
硬件的改變促成了計算攝影時代的到來,廣義上的概念,涵蓋了從人像模式的“假景深”到算法,一切計算形式,幫助手機拍攝出難以置信的手機照片。不是所有的計算攝影都包括人工智能,但人工智能肯定是重要的一個部分。過去,蘋果手機正是基于此,驅(qū)動雙攝像頭的人像模式。iPhone一個攝像頭的圖像信號處理器通過機器學(xué)習(xí)區(qū)分人,另一個攝像頭創(chuàng)建深度圖隔離主體、模糊背景。
這項技能在2016年就出現(xiàn)了,所以,通過機器學(xué)習(xí)識別人并不是什么新生事物。照片軟件組織(photo organization software)也早已經(jīng)做到這一點,智能手機拍照的突破在于,實時性的處理速度。然而,谷歌才是這一領(lǐng)域的領(lǐng)導(dǎo)者,三代Pixel所展示出的結(jié)果令人信服。HDR+是一種默認(rèn)的攝影模型,通過復(fù)雜的算法,融合幾張曝光不足的幀合并為一幀。就像谷歌計算攝影的負(fù)責(zé)人Marc Levoy所言,“機器學(xué)習(xí)只會隨著時間的推移變得更好,同谷歌照片軟件一樣,谷歌已經(jīng)在一個巨大的、被標(biāo)記的照片數(shù)據(jù)庫上訓(xùn)練人工智能。進(jìn)一步幫助相機的曝光,就像Pixel 2,產(chǎn)生了令人印象深刻的照片質(zhì)量基準(zhǔn)?!?
前幾個月,谷歌推出了Night Sight(夜景)功能,Pixel通過機器學(xué)習(xí)技術(shù)以長曝光來精準(zhǔn)地預(yù)測白平衡和色彩。其中,Pixel 3效果最好,可能是算法隨最新的硬件進(jìn)行了迭代。這套算法適用于谷歌所有Pixel系列,甚至是缺少光學(xué)圖像穩(wěn)定性的工程機。這也從側(cè)面說明了,于移動攝影而言,相機的軟件比硬件更為重要。簡而言之,在人工智能的“操持”下,硬件因此擁有了更大的提升空間。
據(jù)雷鋒網(wǎng)了解,華為的Nova 4以及榮耀的View 20,首次采用了索尼IMX586圖像傳感器,4800萬像素,意味著現(xiàn)階段的最高級別分辨率。盡管如此,仍然需要在很多極其微小的單元填滿像素,對圖片質(zhì)量產(chǎn)生不確定性影響。榮耀“AI Ultra Clarity”(人工智能超清晰)模式,擅長于最大限度地利用分辨率,解擾傳感器不常見的色彩濾光器,釋放出額外的細(xì)節(jié)。用戶可以將圖片放大,“海報”級照片應(yīng)運而生。
圖像信號處理器在某一段時間非常重要,隨著計算攝影技術(shù)的進(jìn)步,NPU將會發(fā)揮重要的作用。雖然蘋果公司的A11仿生芯片最先觸達(dá)消費者,但華為是率先宣布在自家麒麟970上,采用人工智能芯片的公司。全球最大的安卓處理器供應(yīng)商高通公司,并未將機器學(xué)習(xí)作為戰(zhàn)略重點。谷歌開發(fā)了自己的芯片Pixel Visual Core,用以幫助人工智能相關(guān)的圖像處理。蘋果最新的A12仿生芯片具有八核神經(jīng)引擎,可以在core ML中運行任務(wù),直接與圖像處理器相連接,比A11快九倍。可以更好地對焦,生成更真實的景深。
所以,芯片對于對于機器學(xué)習(xí)的效率和性能至關(guān)重要。需要說明的是,谷歌的算法是在大型計算機上訓(xùn)練的,大型計算機擁有發(fā)達(dá)的GPU以及英偉達(dá)深度學(xué)習(xí)Tensor Core(張量計算核心),大部分工作可以“提前”完成。一旦將機器學(xué)習(xí)的計算能力搬運到移動端設(shè)備上,可以預(yù)見,在相當(dāng)長的一段時間內(nèi),屬于前沿性研究。
即使目前處于計算攝影的早期階段,神經(jīng)引擎可以減少手機拍照的處理負(fù)擔(dān),隨時間的積累,運行速度越來越快。拍照作為任何手機最基本的功能,面部ID、人臉識別解鎖、AR視頻、AI人像、景物美化、相冊智能分類、智能場景識圖......在過去兩年時間,已經(jīng)深入滲透到普通人的日常生活中。
《2018年中國人工智能手機行業(yè)研究報告》顯示,語音助手、人臉解鎖、智能光線拍攝、美顏和識圖成為2018年中國AI智慧手機用戶最經(jīng)常使的TOP5功能。人臉解鎖、語音助手、隨行翻譯、智能光線拍攝、AI雙攝/三攝、背景虛化成為用戶認(rèn)為最有價值的TOP5功能。
雷鋒網(wǎng)認(rèn)為,指數(shù)級增長遇到物理極限這個“天敵”,沒有休止地持續(xù)增長逐步放緩。未來誰能夠拯救停滯不前的移動攝影,答案不言自明!
相關(guān)文章
- 首屆中國手機攝影大展在蜀啟幕,vivo與中國攝影家協(xié)會共啟全民移動影像創(chuàng)作新篇章
- 聯(lián)通云智手機亮相中關(guān)村論壇 開啟私人訂“智”新時代
- 手機也能跑的模型來了!阿里宣布開源Qwen2.5-Omni-7B
- 億道戶外三防系列:五款三防手機與戶外平板滿足你的所有戶外需求
- 智能手機的新物種:?華為闊折疊手機HUAWEI Pura X
- 首款全面搭載HarmonyOS 5手機HUAWEI Pura X發(fā)布,鴻蒙應(yīng)用新體驗大有不同
- 榮耀MagicBook Pro 14將支持與iPhone手機互傳 打造高效學(xué)習(xí)辦公利器
- 近百款主流應(yīng)用集體發(fā)聲,共迎首款搭載原生鴻蒙正式版手機發(fā)布
- 三星Galaxy Z Flip 7折疊手機渲染圖再度曝光:全屏外屏
- 內(nèi)蒙古聯(lián)通云手機率先與DeepSeek強勢融合 共享云上美好生活
- 三星Galaxy S25+:超越期待的旗艦手機 智能體驗全面升級
- 真我發(fā)布“耐玩戰(zhàn)神“Neo7 SE系列:2000元內(nèi)重構(gòu)游戲手機新標(biāo)桿
- AT&T和Verizon首次實現(xiàn)手機與衛(wèi)星之間的視頻通話
- 來京東搜索“DeepSeek”選購手機、電腦、學(xué)習(xí)機 感受人工智能新體驗
- 2024年12月國內(nèi)市場手機出貨量3452.8萬部,同比增長22.1%
- 三星Galaxy S25系列發(fā)布:AI驅(qū)動的智能手機新紀(jì)元
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 遠(yuǎn)程星智F3E上市首發(fā)!玄武11合1超配搭載,實現(xiàn)效能、可靠、安全性全維躍升
- 人體工學(xué)鼠標(biāo)怎么選?細(xì)品SANWA新款,自帶腕托的溫柔
- 小水智能受邀AI創(chuàng)新者大會:AI發(fā)展落地為王,引領(lǐng) AI兒童腕表細(xì)分領(lǐng)域
- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能