丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給趙晨希
發(fā)送

0

未來幾年,誰能拯救手機拍照功能?

本文作者: 趙晨希 2019-02-04 12:55
導語:受限于物理極限和摩爾定律,既不是攝像頭,也不是傳感器。

手機拍照作為剛需功能,一直是用戶評判一款終端好壞的直接標準之一。受限于物理極限以及摩爾定律,攝像頭和傳感器實現“質”的飛躍,可能性不大。未來幾年,手機攝影的突破點在于AI技術與元器件的深度融合。

近日,在商湯科技與艾瑞咨詢聯合發(fā)布的《2018年中國人工智能手機行業(yè)研究報告》中指出,2006年及以前,手機行業(yè)屬于功能推動階段,從一開始圍繞接打電話到承載拍照、聽音樂、上網等復合功能。2007年至2016年,市場變?yōu)樾阅芡苿与A段,配置成為商家逐鹿的方向。2017年之后,市場進入智能驅動的階段。人工智能開始推動手機產品的迭代,硬件技術的升級需要軟件技術地優(yōu)化和凸顯。

人工智能手機=AI芯片+AI功能,即“滿足AI算力需求移動端芯片,且加載了深度學習AI功能的智能手機。”。AI芯片指內置獨立神經網絡計算單元,通過CPU、GPU、DSP及其他通用計算單元聯動賦能。AI功能囊括人臉解鎖、AI拍照、智能相冊、AI智能助手等等。

報告顯示,巨頭廠商扮演了引領者的角色,多方面推動AI手機落地。2018年,我國4G滲透率達70%,手機市場3G向4G升級結構性紅利漸失。部分硬件提升邊際成本和收益不成正比。這種情況下,預計到2022年,搭載AI功能的智型手機出貨量占比,將從2017年的不到10%提升到80%,年銷量將超13億部。AI手機將是未來行業(yè)的產品方向。

未來幾年,誰能拯救手機拍照功能?

盡管在過去的2018年,AI人工智能手機噱頭滿滿,不乏各種炒作以及不著邊際地吹牛皮。但手機攝影取得的巨大進步,主要在于軟件和硅層,而不是傳感器和鏡頭等硬件。AI人工智能可以更好地理解,圖像呈現的內容。預計未來幾年關于手機攝影的常識,將會從硬件思維轉變?yōu)锳I思維。手機制造商們的人工智能技術水平,將會成為手機拍照功能好壞的主要判斷標準,且這種趨勢絲毫沒有放緩的跡象。

2015年,谷歌上線的APP,清晰地展示了人工智能技術與攝影技術融合之后的照片。在此之前,谷歌一直試圖通過機器學習技術對照片進行分類。谷歌的照片APP直接面向消費者提供人工智能服務,這對于大多數人而言,是難以想象的。“突然之間,用戶可以從雜亂無章、數以千計的圖片庫,轉換為可搜索的資料庫”,“突然之間,谷歌就知道你的貓看起來像什么”。

據雷鋒網了解,2013年,谷歌收購了多倫多大學一家神經網絡方面的初創(chuàng)公司DNNResearch,用以推動谷歌基于語音和圖片的搜索功能。該公司通過訓練人類標記的數據,訓練深度學習網絡,此過程被成為監(jiān)管學習(Supervised Learning)。具體而言,在數百萬張圖片上訓練網絡,以使得它能夠通過像素級別的視覺線索,來幫助圖片識別分類。隨著時間的推移,算法將會識別得越來越準確。

比如,一個大熊貓,囊括了可以正確識別熊貓動物品類,黑色皮毛與白色皮毛的比例,以及和荷蘭奶牛皮毛的區(qū)別。進一步訓練以后,理解更加抽象的詞匯成為可能。例如,“動物”、“早餐”等,對人類而言比較簡單,但對機器來講,屬于沒有視覺輸出的詞匯。

訓練完以上的模型,需要大量的時間以及整理能力。一旦數據中心完成之后,它將可以以低功耗、便捷的方式在設備上運行。如今,前期這些繁重的工作已經完成,只要把照片上傳到云端,谷歌就可以通過模型來分類、標記整個圖片庫。

谷歌圖片功能發(fā)布大約一年之后,蘋果發(fā)布了基于神經網絡(類似谷歌)的搜索照片功能。但鑒于蘋果用戶隱私條例的承諾,蘋果的分類功能實際上是在每個設備中單獨進行的,設置后在后臺進行,并不發(fā)送數據,用時長達一到兩天時間。

盡管和照片智慧管理是一回事,但人工智能和機器學習,毫無疑問,對于照片拍攝具有重大意義。攝像頭和傳感器可以“比大更大”,可是又起到怎樣的作用呢?攝像頭、傳感器已經達到物理極限。如今,在某些情況下,手機拍攝的照片比傳統照相機拍得更好已經不是什么“稀罕事”。其背后深層次原因在于,傳統相機無法在芯片維度與手機競爭。手機芯片系統包括CPU、圖像信號處理器、越來越多的神經處理單元NPU。

未來幾年,誰能拯救手機拍照功能?

硬件的改變促成了計算攝影時代的到來,廣義上的概念,涵蓋了從人像模式的“假景深”到算法,一切計算形式,幫助手機拍攝出難以置信的手機照片。不是所有的計算攝影都包括人工智能,但人工智能肯定是重要的一個部分。過去,蘋果手機正是基于此,驅動雙攝像頭的人像模式。iPhone一個攝像頭的圖像信號處理器通過機器學習區(qū)分人,另一個攝像頭創(chuàng)建深度圖隔離主體、模糊背景。

這項技能在2016年就出現了,所以,通過機器學習識別人并不是什么新生事物。照片軟件組織(photo organization software)也早已經做到這一點,智能手機拍照的突破在于,實時性的處理速度。然而,谷歌才是這一領域的領導者,三代Pixel所展示出的結果令人信服。HDR+是一種默認的攝影模型,通過復雜的算法,融合幾張曝光不足的幀合并為一幀。就像谷歌計算攝影的負責人Marc Levoy所言,“機器學習只會隨著時間的推移變得更好,同谷歌照片軟件一樣,谷歌已經在一個巨大的、被標記的照片數據庫上訓練人工智能。進一步幫助相機的曝光,就像Pixel 2,產生了令人印象深刻的照片質量基準。”

前幾個月,谷歌推出了Night Sight(夜景)功能,Pixel通過機器學習技術以長曝光來精準地預測白平衡和色彩。其中,Pixel 3效果最好,可能是算法隨最新的硬件進行了迭代。這套算法適用于谷歌所有Pixel系列,甚至是缺少光學圖像穩(wěn)定性的工程機。這也從側面說明了,于移動攝影而言,相機的軟件比硬件更為重要。簡而言之,在人工智能的“操持”下,硬件因此擁有了更大的提升空間。

據雷鋒網了解,華為的Nova 4以及榮耀的View 20,首次采用了索尼IMX586圖像傳感器,4800萬像素,意味著現階段的最高級別分辨率。盡管如此,仍然需要在很多極其微小的單元填滿像素,對圖片質量產生不確定性影響。榮耀“AI Ultra Clarity”(人工智能超清晰)模式,擅長于最大限度地利用分辨率,解擾傳感器不常見的色彩濾光器,釋放出額外的細節(jié)。用戶可以將圖片放大,“海報”級照片應運而生。

圖像信號處理器在某一段時間非常重要,隨著計算攝影技術的進步,NPU將會發(fā)揮重要的作用。雖然蘋果公司的A11仿生芯片最先觸達消費者,但華為是率先宣布在自家麒麟970上,采用人工智能芯片的公司。全球最大的安卓處理器供應商高通公司,并未將機器學習作為戰(zhàn)略重點。谷歌開發(fā)了自己的芯片Pixel Visual Core,用以幫助人工智能相關的圖像處理。蘋果最新的A12仿生芯片具有八核神經引擎,可以在core ML中運行任務,直接與圖像處理器相連接,比A11快九倍??梢愿玫貙?,生成更真實的景深。

所以,芯片對于對于機器學習的效率和性能至關重要。需要說明的是,谷歌的算法是在大型計算機上訓練的,大型計算機擁有發(fā)達的GPU以及英偉達深度學習Tensor Core(張量計算核心),大部分工作可以“提前”完成。一旦將機器學習的計算能力搬運到移動端設備上,可以預見,在相當長的一段時間內,屬于前沿性研究。

未來幾年,誰能拯救手機拍照功能?

即使目前處于計算攝影的早期階段,神經引擎可以減少手機拍照的處理負擔,隨時間的積累,運行速度越來越快。拍照作為任何手機最基本的功能,面部ID、人臉識別解鎖、AR視頻、AI人像、景物美化、相冊智能分類、智能場景識圖......在過去兩年時間,已經深入滲透到普通人的日常生活中。

《2018年中國人工智能手機行業(yè)研究報告》顯示,語音助手、人臉解鎖、智能光線拍攝、美顏和識圖成為2018年中國AI智慧手機用戶最經常使的TOP5功能。人臉解鎖、語音助手、隨行翻譯、智能光線拍攝、AI雙攝/三攝、背景虛化成為用戶認為最有價值的TOP5功能。

雷鋒網認為,指數級增長遇到物理極限這個“天敵”,沒有休止地持續(xù)增長逐步放緩。未來誰能夠拯救停滯不前的移動攝影,答案不言自明!

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章

編輯

簡單是終極的復雜。WeChat:chenxi252516
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說