0
本文作者: 沐沐 | 2017-04-27 17:21 |
雷鋒網(wǎng)硬創(chuàng)公開課聚焦于新技術(shù)和新產(chǎn)品的 Know-How 分享,在過去的一年里,雷鋒網(wǎng)和同行的技術(shù)創(chuàng)新者們都趕上了相當好的時候。
當以品牌和渠道驅(qū)動的那些智能硬件、以資本驅(qū)動的那些O2O、以抄襲模仿起家的那些虛擬現(xiàn)實項目們熱潮褪去,同時在新興技術(shù)領(lǐng)域,由于機器學(xué)習(xí)和計算基礎(chǔ)設(shè)施的發(fā)展,語音、語義、圖像技術(shù)開始出現(xiàn)較為繁冗的應(yīng)用。
以下為雷鋒網(wǎng)硬創(chuàng)公開課整理的人工智能往期公開課實錄筆記,供各位讀者參考學(xué)習(xí):
CV
目前最新的美顏技術(shù)已經(jīng)發(fā)展到了 2.0 階段,打個比方,如果美顏 1.0 只是化妝(磨皮、祛痘、膚色調(diào)整)的話,美顏 2.0 基本就能達到整容的效果——把眼睛變大,把圓臉變成瓜子臉。而實現(xiàn)這一效果的基礎(chǔ)就是人臉識別。
去年 ILSVRC 2016(全稱是ImageNet Large Scale Visual Recognition Challenge)分為五大部分,包括:目標檢測、目標定位、視頻中目標物體檢測、場景分類、場景分析。在昨天,全球最為權(quán)威的計算機視覺大賽 ILSVRC2016(大規(guī)模圖像識別競賽)公布了算法排名結(jié)果,Hikvision(海康威視)奪得場景分類第一名。
很多人疑惑,為什么深度學(xué)習(xí)相比其它的AI實現(xiàn)方法,已然呈現(xiàn)出一副碾壓之態(tài)?
這種技術(shù)叫以圖搜視頻,它解決了當前針對海量視頻內(nèi)容的精準快速檢索的硬傷。
直播火爆的背后,都存在哪些問題?機器如何識別小黃圖?
人工智能是人類一個非常美好的夢想,跟星際漫游和長生不老一樣。我們想制造出一種機器,使得它跟人一樣具有一定的對外界事物感知能力,比如看見世界。
NLP
每天都用搜狗的輸入法、語音、地圖,知道他們的語義理解是如何實現(xiàn)的嗎?
不少企業(yè)都把目光聚焦在視頻鑒黃上,但音頻審核也是人工智能鑒黃技術(shù)的一部分,二者缺一不可。那在大家熟悉的視頻鑒黃之外,音頻檢測究竟能解決哪些問題?這一技術(shù)是如何進行鑒黃的呢?
其實,老羅發(fā)布會上宣傳了97%這個數(shù)字,我們達到這個數(shù)字其實已經(jīng)有一兩年時間了。
特邀供職于阿里巴巴 iDST 的語音專家薛少飛博士,從學(xué)術(shù)的角度回顧過去一段時間中語音識別技術(shù)的發(fā)展狀況。
這兩種學(xué)習(xí)方法更接近生物體,或者說人的學(xué)習(xí)方式,所以我更愿意稱之為“Human-like Learning”。
語音識別的模型有語言模型和聲學(xué)模型兩種,語言模型包括了N-gram、RNNLM等,在聲學(xué)模型里面又涵蓋了HMM、DNN、RNN等模型。
語音識別是目前應(yīng)用最成熟的人機交互方式,但各家語音識別產(chǎn)品的體驗還有很大的提升空間。
音頻的端點檢測、降噪和音頻壓縮始終是終端語音處理關(guān)注的重點,目前仍是活躍的研究主題。
中文分詞是中文自然語言處理的一個非常重要的組成部分,在學(xué)界和工業(yè)界都有比較長時間的研究歷史,也有一些比較成熟的解決方案。
我們邀請到了商鵲網(wǎng)CEO鄒劍宇,以實戰(zhàn)經(jīng)驗為我們解讀,什么樣的機器翻譯比Google還要占優(yōu)?
深度學(xué)習(xí)框架與生物識別
格靈深瞳 CEO 趙勇博士基于自己多年的研究和行業(yè)經(jīng)驗,深入分享 AI 技術(shù)將怎樣以智能硬件、大數(shù)據(jù)挖掘和物聯(lián)網(wǎng)的形式,深刻地變革整個安防行業(yè)。
如果人工智能是一個蛋糕的話,那么“蛋糕胚”不僅是指無監(jiān)督的數(shù)據(jù)表示學(xué)習(xí),還應(yīng)該包括“無監(jiān)督推斷學(xué)習(xí)”,而GAN確實很好地連接了這兩個重要的人工智能主體。
Tensorflow到底適合如何拿來做開發(fā)?能不能為你的研究或者產(chǎn)品帶來更好的機會?
正如程序語言一樣,深度學(xué)習(xí)開源框架同樣各有優(yōu)劣和適用的場景,那么 AI 從業(yè)者該如何有針對性地選擇這些平臺來玩轉(zhuǎn)深度學(xué)習(xí)?
虹膜識別目前是一門新興的技術(shù),在生物特征識別領(lǐng)域?qū)嶋H上是被認為可以在某種程度上取代今天的指紋和人臉識別,也是精度最高的生物特征識別技術(shù)。
從人臉識別和情緒識別區(qū)別開始,循序漸進到情緒識別原理,情緒識別的應(yīng)用場景,最后為我們揭秘這個過程是如何實現(xiàn)的。
隨著人臉識別技術(shù)的普及,不光可以靠“刷臉”支付吃喝玩樂的花費,現(xiàn)在連銀行辦業(yè)務(wù)都可以“刷臉”了。
《TensorFlow實戰(zhàn)》作者黃文堅,為我們講解了關(guān)于四大經(jīng)典CNN網(wǎng)絡(luò):AlexNet、VGGNet、Google?Inception?Net和ResNet的基本原理。
行業(yè)
余凱對去年 AI 圈內(nèi)的各種現(xiàn)象,發(fā)表了自己的獨到觀點和看法。
隨著AI的快速發(fā)展,AI到底能不能跟我們的智能相提并論。
深度學(xué)習(xí)并不萬能,AI的未來還得靠人類。
本期硬創(chuàng)公開課,我們特意請到了微軟亞洲研究院副研究員張富崢博士,來談?wù)勊谖④泚喼扪芯吭汗ぷ鞯捏w驗和他眼中的微軟亞洲研究院。
怎么在浩如煙海的數(shù)據(jù)中篩選出對我們真正有用的那些?又如何通過分析這些數(shù)據(jù)做出對自身有利的決策?
相信不少學(xué)者在面對艱深的科研課題的時候,心中都有過那么一絲疑惑:這東西何時能實現(xiàn)產(chǎn)業(yè)化,真正造福社會?
深度學(xué)習(xí)可以用在很多領(lǐng)域,前面說過了,只要這個領(lǐng)域需要構(gòu)建一個模型來預(yù)測,而且有大量標注的訓(xùn)練數(shù)據(jù)。
由圍棋棋手解讀人機大戰(zhàn)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。