0
本文作者: 亞萌 | 2016-11-27 21:43 |
美國(guó)時(shí)間 11 月 22 日,亞馬遜 CTO Werner Vogels 在博文中寫(xiě)到 MXNet 被 AWS 正式選擇成為其云計(jì)算的官方深度學(xué)習(xí)平臺(tái)。
MXNet 是一個(gè)全功能、靈活且高擴(kuò)展性的深度學(xué)習(xí)框架,支持深度學(xué)習(xí)模型中的卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)期短期記憶網(wǎng)絡(luò)。由學(xué)術(shù)界發(fā)起,由華盛頓大學(xué)和卡內(nèi)基梅隆大學(xué)的研究人員聯(lián)合發(fā)起。
MXNet 聯(lián)合發(fā)起人解浚源表示:
“MXNet 發(fā)展到現(xiàn)在有一年多時(shí)間,是一個(gè)相對(duì)成熟的項(xiàng)目。我對(duì)我們的技術(shù)很有信心。MXNet 的速度,節(jié)省內(nèi)存,接口靈活性,和分布式效率都是可圈可點(diǎn)的。作為一個(gè)由愛(ài)好者發(fā)起,沒(méi)有投資的項(xiàng)目,MXNet 以前最大的短板是文檔和宣傳。而 Amazon 作為大財(cái)主以后在這方面可以起到很好的作用?!?/p>
LeCun 在卡內(nèi)基梅隆大學(xué)機(jī)器人研究所進(jìn)行了一場(chǎng) AI 技術(shù)核心問(wèn)題與發(fā)展前景的演講。他在演講中提到三點(diǎn)干貨:
1. 無(wú)監(jiān)督學(xué)習(xí)代表了 AI 技術(shù)的未來(lái)。
2. 當(dāng)前 AI 應(yīng)用的熱點(diǎn)集中在卷積神經(jīng)網(wǎng)絡(luò)。
3. 用模擬器提高無(wú)監(jiān)督學(xué)習(xí)的效率是大勢(shì)所趨。
如今的深度學(xué)習(xí)系統(tǒng)現(xiàn)在用的都是監(jiān)督學(xué)習(xí)(supervised learning),輸入的數(shù)據(jù)被人為加上標(biāo)簽。接下來(lái)的挑戰(zhàn)在于,怎么讓機(jī)器從未經(jīng)處理的、無(wú)標(biāo)簽無(wú)類別的數(shù)據(jù)中進(jìn)行學(xué)習(xí),比方說(shuō)視頻和文字。而這就是無(wú)監(jiān)督學(xué)習(xí)(unsupervised learning)。
Yann LeCun 做了一個(gè)比喻:假設(shè)機(jī)器學(xué)習(xí)是一個(gè)蛋糕,強(qiáng)化學(xué)習(xí)是蛋糕上的一粒櫻桃,監(jiān)督學(xué)習(xí)是外面的一層糖衣,無(wú)監(jiān)督學(xué)習(xí)則是蛋糕糕體。無(wú)監(jiān)督學(xué)習(xí)的重要性不言而喻。為了讓強(qiáng)化學(xué)習(xí)奏效,也離不開(kāi)無(wú)監(jiān)督學(xué)習(xí)的支持。
Yann LeCun 表示,神經(jīng)網(wǎng)絡(luò)越大,效果就越好(當(dāng)然前提是數(shù)據(jù)庫(kù)大小達(dá)到了臨界值)。至于為什么會(huì)這樣,目前仍是一個(gè)謎,相關(guān)理論研究正在開(kāi)展。他特別強(qiáng)調(diào)了卷積神經(jīng)網(wǎng)絡(luò)的重要性和應(yīng)用,他接著作出預(yù)測(cè),下一個(gè)將會(huì)十分流行的技術(shù)是記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)。它可被理解為用記憶增強(qiáng)的遞歸神經(jīng)網(wǎng)絡(luò),其中,記憶本身是一個(gè)能被區(qū)分的回路,并可以作為學(xué)習(xí)中的一部分用于訓(xùn)練。
美國(guó)時(shí)間 11 月 22 日,基于 Zero-Shot 的多語(yǔ)言神經(jīng)機(jī)器學(xué)習(xí)系統(tǒng)正式登陸谷歌翻譯。它目前被應(yīng)用于新增加的 16 個(gè)語(yǔ)言組中的 10個(gè),帶來(lái)更高的翻譯質(zhì)量和簡(jiǎn)化的系統(tǒng)架構(gòu)。我們可以期待在不久的將來(lái),該系統(tǒng)會(huì)逐步支持更多的谷歌翻譯語(yǔ)種。
Zero-Shot 翻譯是指在完成語(yǔ)言 A 到語(yǔ)言 B 的翻譯訓(xùn)練之后,語(yǔ)言 A 到語(yǔ)言 C 的翻譯不需要再經(jīng)過(guò)任何學(xué)習(xí)。 它能自動(dòng)把之前的學(xué)習(xí)成果轉(zhuǎn)化到翻譯任意一門(mén)語(yǔ)言,即便工程師們從來(lái)沒(méi)有進(jìn)行過(guò)相關(guān)訓(xùn)練。
通過(guò) Zero-Shot,谷歌解決了把神經(jīng)機(jī)器翻譯系統(tǒng)擴(kuò)展到全部語(yǔ)言的難題。有了它,一套系統(tǒng)就可以完成所有語(yǔ)言的互翻。從前兩種語(yǔ)言之間都需要多個(gè)翻譯系統(tǒng)的情況,從此成為了歷史。這套架構(gòu)在翻譯其他語(yǔ)言時(shí),不需要在底層 GNMT 系統(tǒng)做任何改變。只需在輸入語(yǔ)句的開(kāi)頭插入一個(gè)輸出語(yǔ)種標(biāo)記,就可以把結(jié)果翻譯為任意語(yǔ)言。
11月 22日,百度舉行了語(yǔ)音開(kāi)放平臺(tái)三周年主題活動(dòng),百度首席科學(xué)家吳恩達(dá)現(xiàn)場(chǎng)發(fā)表演講。他表示百度大腦最核心的幾個(gè)技術(shù)部分為:
語(yǔ)音
圖像
自然語(yǔ)言處理
用戶畫(huà)像
機(jī)器學(xué)習(xí)平臺(tái)
這幾年來(lái),我們的團(tuán)隊(duì)在不斷地優(yōu)化語(yǔ)音識(shí)別系統(tǒng)。在2012年開(kāi)始使用DNN模型,后來(lái)有比較好的特征,之后開(kāi)始用Sequence Discriminative Training,也開(kāi)始使用LSTM模型,加上CTC,今年我們的團(tuán)隊(duì)開(kāi)發(fā)了Deep CNN模型。
在百度大腦已經(jīng)有好幾種不同的人工智能技術(shù),其中比較成熟的,就是我們的語(yǔ)音技術(shù)。
在很多最重要的百度產(chǎn)品中,我們已經(jīng)支持語(yǔ)音輸入,包括手機(jī)百度、百度地圖、百度輸入法。如果你還沒(méi)有試過(guò)百度輸入法,我希望你試一試,我輸入信息時(shí)就挺喜歡用百度輸入法。還有度秘,最近我們把度秘放入各類硬件中,比如小度機(jī)器人。
在百度大腦開(kāi)放平臺(tái)(ai.baidu.com)上,我們不僅輸出人工智能技術(shù),也有很多有關(guān)人工智能技術(shù)的培訓(xùn)資料。如果你是使用百度大腦開(kāi)放平臺(tái),你可以比較容易的選擇真正需要的技術(shù)部分把它放進(jìn)來(lái),把它融合,為你做到最好的效果。再比如說(shuō)你想服務(wù)一個(gè)智能客戶,開(kāi)始的時(shí)候覺(jué)得只需要語(yǔ)音識(shí)別、語(yǔ)音合成技術(shù),但是做了幾個(gè)月以后,發(fā)現(xiàn)你需要最領(lǐng)先的自然語(yǔ)言處理技術(shù)。如果你是使用百度大腦開(kāi)放平臺(tái),希望你比較容易拿到這些技術(shù)放到自己的產(chǎn)品中。
我個(gè)人對(duì)人工智能的未來(lái)充滿信心,我希望未來(lái)我們會(huì)有陪伴機(jī)器人、個(gè)性化私教、音樂(lè)作曲、機(jī)器人醫(yī)生等等。
11 月 23 日,科大訊飛舉行了年度發(fā)布會(huì),董事長(zhǎng)劉慶峰的做了主題演講,他表示 2016 年已經(jīng)成了中國(guó)人工智能的歷史元年,人工智能的第三次大潮,已經(jīng)切實(shí)到來(lái)了,已經(jīng)不再是一個(gè)概念,而是可以進(jìn)入一個(gè)又一個(gè)的行業(yè)。
人工智能有 3 個(gè)層次:計(jì)算智能(機(jī)器人能計(jì)算和存儲(chǔ))、感知智能(機(jī)器的視覺(jué)、聽(tīng)覺(jué)可以超過(guò)人工)和認(rèn)知智能(未來(lái)的核心)。而以語(yǔ)音和語(yǔ)言為入口的認(rèn)知計(jì)算,是人工智能的必由之路。
訊飛在眾多國(guó)際比賽中都獲得傲人成績(jī)。全球的語(yǔ)音合成大賽暴風(fēng)雪競(jìng)賽中,訊飛在英文領(lǐng)域獲得全球第一名,把英語(yǔ)合成做到了超過(guò)普通人說(shuō)話水平。 在Chime語(yǔ)音識(shí)別競(jìng)賽中,在噪音環(huán)境下訊飛的英文語(yǔ)言錯(cuò)誤率只有 2.24%。在 2014 年國(guó)際口語(yǔ)翻譯大賽( IWSLT)中, 訊飛獲得英漢翻譯、漢英翻譯兩個(gè)項(xiàng)目的全球第一。另外在 Winogard 認(rèn)知智能測(cè)試、 KBP 認(rèn)知大賽中,訊飛都獲得了不菲成績(jī)。
所以這些在國(guó)際頂尖舞臺(tái)上的認(rèn)知成果,真正證明了我們中國(guó)人在人工智能領(lǐng)域已經(jīng)不僅僅是一個(gè)科普、科幻或者帶有所謂先知角度的感性判斷,而是在踏踏實(shí)實(shí)做理論創(chuàng)新。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。