0
本文作者: camel | 編輯:郭奕欣 | 2017-10-28 23:26 | 專題:CNCC 2017 |
雷鋒網(wǎng)AI科技評論消息,10月27日上午8:30,第十四屆中國計算機大會(CNCC 2017)正式邁入第二天的日程。雷鋒網(wǎng)作為CNCC 2017 獨家戰(zhàn)略合作媒體,大會期間將會在現(xiàn)場全程跟蹤報道。會議最新動態(tài)請關(guān)注雷鋒網(wǎng)(ID:leiphone-sz)以及AI科技評論(ID:aitechtalk)微信公眾號。
本次大會主題是“人工智能改變世界(AI Changes the World)”,共邀請近十位院士、300余位國內(nèi)外計算機領(lǐng)域知名專家、著名國際國內(nèi)IT企業(yè)家到會演講。會議包括14個特邀報告、2場大會論壇、40余場前沿技術(shù)論壇及30余場特色活動,同期舉辦科技成果展,匯聚80余家企業(yè)參展。大會已成功舉辦13屆,此次參會規(guī)模也是迄今為止最大,人數(shù)最多的一次,共計有近700家企事業(yè)單位,超過6000名專業(yè)人士參會參展。
27日上午共進行了八場特邀報告。
特邀嘉賓:Dinesh Manocha教授
報告主題:Motion Planning Technologies for Human-Robot Interaction
Dinesh教授首先介紹了機器人在制造、裝配、倉庫自動化和服務(wù)行業(yè)得到的越來越廣泛的應(yīng)用,隨后認(rèn)為目前的機器人在處理新環(huán)境或與人類合作等方面的能力還很有限。
報告中,Dinesh介紹了在開發(fā)機器人運動和任務(wù)規(guī)劃能力方面的一些挑戰(zhàn),包括實時規(guī)劃算法。隨后他介紹了他們提出的實時運動規(guī)劃的的新技術(shù)以及如何將他們與視覺算法結(jié)合起來進行人類行為預(yù)測以及自然語言處理。由此產(chǎn)生的方法結(jié)合了人工智能規(guī)劃、拓撲、優(yōu)化、計算機視覺、機器學(xué)習(xí)、自然語言處理和并行計算等研究的思想。隨后他展示了他們研究的許多應(yīng)用,包括自主采摘、避免障礙等。
特邀嘉賓:陳熙霖
報告主題:從物體識別到場景理解
首先陳熙霖教授介紹了視覺在動物生活中的重要作用,隨后簡短地介紹了計算機視覺的歷史。隨著深度學(xué)習(xí)的引入,計算機視覺得到了很大的發(fā)展。但仍然喜憂參半,喜的是計算機視覺逐漸走向工業(yè)應(yīng)用,而憂的是高精度背后的穩(wěn)定性還存在風(fēng)險、結(jié)論的可解釋性與推廣性還有待提高、和人類似的感知的一致性還有待研究。陳熙霖教授認(rèn)為計算機視覺仍然很低能,因為它們沒有被賦予給知識。隨后陳老師通過一系列的例子給我們分享了幾個計算機視覺研究的觀點:1、計算機視覺在識別之后應(yīng)當(dāng)是理解,應(yīng)當(dāng)超越視力,達到視覺與視覺智能;2、計算機視覺的研究要超越桌面視覺,將它與機器人、語言等結(jié)合起來;3、計算機視覺應(yīng)當(dāng)研究如何自動感受并建立元視覺概念集;4、計算機視覺的研究應(yīng)當(dāng)從任務(wù)驅(qū)動走向事件/數(shù)據(jù)驅(qū)動。
特邀嘉賓:王涌天
報告主題:“無屏”呈現(xiàn)——人機融合的新紀(jì)元
王涌天教授認(rèn)為人類發(fā)展的歷史是人類與信息逐漸融合的歷史,人與信息世界的融合歷程大致經(jīng)歷了三代演繹,分別為電影屏幕、電視屏幕和移動屏幕。隨著現(xiàn)在虛擬現(xiàn)實和增強現(xiàn)實的發(fā)展,我們將會有第四塊無屏之屏幕:VR/AR屏。這種無屏將會帶來人機融合的真正改變,實現(xiàn)人與信息的全天候深度融合。但是如果沒有對信息的過濾,那么人類將淹沒在大量的信息中,因此無屏必須與人工智能融合在一起發(fā)展。
當(dāng)然現(xiàn)在無屏還有很多技術(shù)的痛點,王涌天教授認(rèn)為真正的自然顯示與交互應(yīng)該讓使用者忘卻科技產(chǎn)品的存在,以更為親和的方式實現(xiàn)信息融合,使得設(shè)備可以被用戶“無視”。所以這個無屏之屏要做到顯示透明化、交互自然話、穿戴無擾化等。王涌天教授隨后詳細介紹了他們實驗室在這三個方面的工作。其研究現(xiàn)在已經(jīng)應(yīng)用到了圓明園現(xiàn)場重建、醫(yī)學(xué)上的手術(shù)導(dǎo)航系統(tǒng)、宇航員心理舒緩系統(tǒng)、增強現(xiàn)實輔助維修系統(tǒng)以及一些面向大眾的一些應(yīng)用等上面。
最后王涌天分享了他們實驗室的一句口號及圖片:移動增強現(xiàn)實使人類第二次站立起來。
特邀嘉賓:章文嵩
報告主題:滴滴共享出行與智慧交通
據(jù)章文嵩介紹,在交通領(lǐng)域存在著資源有限、供需不平衡等問題,通過共享出行的方式,滴滴重構(gòu)了出行的供需平衡問題。經(jīng)過5年的高速發(fā)展,滴滴在交通領(lǐng)域的積累了大量的數(shù)據(jù)和技術(shù)。報告中介紹,滴滴峰值訂單量超高2500多萬/小時,每日定位軌跡數(shù)據(jù)超過70TB,每日處理數(shù)據(jù)超過4500TB;在人工智能、云計算、信息安全等方面滴滴也有大量的研究,例如智能派單、高穩(wěn)定性、數(shù)據(jù)保護等。
除了這些,滴滴也逐漸在考慮交通的環(huán)境,例如路況規(guī)劃等。滴滴的價值在于擁有大量且詳細的交通數(shù)據(jù),技術(shù)較為完備,并且能夠提供一個平臺。例如他們提供的交通大數(shù)據(jù)平臺,能夠為交通管理部門、政策制定部門、城市建設(shè)部門、客運物流公司等提供服務(wù)。此外他們還能夠提供交通路況、智慧信號燈、OD數(shù)據(jù)分析、運力調(diào)度、供需預(yù)測等服務(wù)。
滴滴目前正大力促進一站式出行的方案,從而優(yōu)化出行結(jié)構(gòu)。最后章文嵩介紹了滴滴在智慧交通方面的一些解決方案,例如滴禹一體化方案、交通運行報告(城市擁堵排名、運行分析、熱門起終點分析)、實時城市擁堵排名、城市運行指數(shù)、異常擁堵、代駕熱力圖、智慧誘導(dǎo)屏(國內(nèi)已經(jīng)安裝70多塊)、智慧信號燈、潮汐車道、實時公交&換乘、一站式出行服務(wù)等。
特邀嘉賓:叢京生
報告主題:Computing Near the End of Moore's Law
叢京生教授認(rèn)為我們現(xiàn)在已經(jīng)接近摩爾定律的末尾,已經(jīng)不能在簡單的依靠頻率或者內(nèi)核的縮小來大規(guī)模地提高計算機的性能。他認(rèn)為未來的計算系統(tǒng)會將會使用定制的芯片,例如谷歌專門為做人工智能開發(fā)的TPU芯片。在報告中,叢教授首先簡單回顧了他們在可定制芯片的研究,包括單片機、服務(wù)器節(jié)點、數(shù)據(jù)中心以及FPGAs(field-programmable gate-arrays)。隨后叢教授介紹了他們的研究在幾個領(lǐng)域的成功應(yīng)用,例如機器學(xué)習(xí)和計算基因組學(xué)。最后他介紹了他們正在進行的定制計算啟用自動化的工作,并重點介紹了算法和實施方面的挑戰(zhàn),以及他們對許多編譯和運行時優(yōu)化問題的解決方案。
特邀嘉賓:李志飛
報告主題:語音交互技術(shù)將如何重塑下一代消費電子
李志飛在報告中主要講了智能音箱在整個行業(yè)中的趨勢以及語音交互的一些標(biāo)準(zhǔn)。
他首先舉例亞馬遜的echo,認(rèn)為他們之所以成功,是因為語音是他們與用戶溝通的唯一方式?,F(xiàn)在智能音箱也是如此。
在智能音箱的行業(yè)趨勢方面,他介紹了幾個主要的趨勢。首先,智能音箱在美國正處于高速發(fā)展的前夜,而中國還要稍晚一步。消費電子大趨勢就是智能化,包括耳機、電視、汽車等。其用戶滲透的趨勢就是,從北美到歐洲隨后到中國。
李志飛介紹了出門問問的技術(shù)探索之路,在2012年他們開始積累AI技術(shù),13年開始探索語音助手軟件,14年開始軟硬結(jié)合,進行場景探索,到17年則開始開發(fā)跨場景聯(lián)動的虛擬個人助理。
隨后李志飛講解了實現(xiàn)語音交互的五個步驟:遠場喚醒、語音識別、語義理解、垂直搜索、語音合成。他認(rèn)為判斷語音交互體驗好壞的標(biāo)準(zhǔn)可以用五個字來概括,分別為:遠(遠場)、快(快速響應(yīng))、準(zhǔn)(準(zhǔn)確率高)、全(技能有多少)、深(多輪對話)。
特邀嘉賓:何源
報告主題:從瓦薩沉船到數(shù)字孿生——物聯(lián)網(wǎng)的機遇和挑戰(zhàn)
何源首先非常生動地介紹了瓦薩沉船的故事,瓦薩沉船成為瑞典王國由衰轉(zhuǎn)盛的標(biāo)志。從這個故事中何源副教授認(rèn)為可以獲取三個啟示:設(shè)計制造流程無法響應(yīng)不斷改變的用戶需求;設(shè)計方案和制造進展情況無法全面細致掌握;木已成舟前無法評估戰(zhàn)艦的安全性和可用性。
數(shù)字孿生以數(shù)字化方式為物理對象創(chuàng)建的虛擬模型,來反應(yīng)物理對象的全生命周期過程。通過在虛擬和現(xiàn)實世界的無縫鏈接,可以協(xié)同仿真與設(shè)計、監(jiān)控制造執(zhí)行過程、產(chǎn)品使用狀態(tài)跟蹤,同時數(shù)據(jù)驅(qū)動的服務(wù)。
隨后何源介紹了國家電網(wǎng)特高壓換流站無人值守檢測和診斷系統(tǒng)。這個系統(tǒng)包括設(shè)備狀態(tài)實時跟蹤、故障分析與診斷、環(huán)境人員監(jiān)控和遠程協(xié)作。類似的我們能夠發(fā)現(xiàn)很多類似應(yīng)用場景,例如物聯(lián)網(wǎng)。物聯(lián)網(wǎng)進入了新的發(fā)展階段。物聯(lián)網(wǎng)與傳統(tǒng)行業(yè)深度融合,呈現(xiàn)出應(yīng)用需求多樣化、網(wǎng)絡(luò)終端異構(gòu)化、運維空間同一化的顯著特征,推動該領(lǐng)域研究向縱深發(fā)展。何源在報告中簡單介紹了他們的近期的一些研究,包括無緣感知網(wǎng)絡(luò)的并發(fā)傳輸、跨協(xié)議通信技術(shù)。最后何源介紹了未來的機遇和挑戰(zhàn),認(rèn)為最卓越的技術(shù)恰恰是會消失的技術(shù),未來的計算機將不僅融入到我們的生活,而且他們將深度地連結(jié)在一起,為我們創(chuàng)造更加智慧的未來。
特邀嘉賓:劉偲
報告主題:圖像的像素級語義理解
劉偲首先通過自己一天中可能遇到的事情,生動地引入了深度學(xué)習(xí)的圖像視頻分析問題。近年來,基于深度學(xué)習(xí)的圖像視頻分析技術(shù)取得了巨大成功。相比于傳統(tǒng)的物體分類識別技術(shù),圖像的像素級語義理解,又稱語義分割,能提供更加豐富的像素級信息, 因而成為一個新的研究熱點。
劉偲在報告中介紹了他們小組在語義分割領(lǐng)域的三個方向的研究,分別為場景解析、人體解析、人臉解析。
場景解析氛圍室內(nèi)場景和室外場景。他們在室內(nèi)場景提出了一個魔幻墻的系統(tǒng),能夠自動的換壁紙的效果;室外場景中她介紹了一個去霧霾的效果。
人體解析的重要性在于能夠幫助進行視頻監(jiān)控,他們針對這個問題設(shè)計了一個時序上下文的視頻解析算法,包括三個模塊,分別為單幀圖片解析、幀間光流估計、時序上下文融合。
針對人臉解析,他們設(shè)計了一套自適應(yīng)調(diào)節(jié)視野域的人臉解析模型。其應(yīng)用包括智能美妝、妝容遷移、人臉老化。
雖然基于深度學(xué)習(xí)的語義分割取得了很大的進展,但是未來依然有很大的提升空間。劉偲認(rèn)為以后的方向集中在幾個方面:深度模型小型化、信息源多模態(tài)化、數(shù)據(jù)標(biāo)注的低成本化。
以上為八位特邀嘉賓演講報告概覽,上午同期還舉辦了CCF CCSP頒獎會。大會下午則有14場技術(shù)論壇、10場活動;在晚間,除了兩場活動外,還有令人激動的CNCC頒獎晚宴。雷鋒網(wǎng)作為獨家戰(zhàn)略合作媒體,后續(xù)將為讀者帶來更多議程的詳細報道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章