0
本文作者: 黃善清 | 編輯:汪思穎 | 2019-01-02 09:34 | 專題:2018年科技業(yè)年終盤點 |
雷鋒網(wǎng) AI 科技評論按:昨天,我們盤點了 2018 年度的人工智能熱門事件,得出了「悲喜交加」的結(jié)論:一方面是人工智能技術(shù)的碩果累累,一方面是人工智能帶來的道德危機,隨著 2019 年的到來,雷鋒網(wǎng) AI 科技評論將繼續(xù)陪伴大家關(guān)注國內(nèi)外人工智能界的最新走向。
開年第一天,來點輕松的,我們?yōu)榇蠹艺砹?2018 年人工智能界的 10 個逗趣瞬間。笑完以后,大家在 2019 年還是要努力干活,繼續(xù)為人工智能的發(fā)展「添磚加瓦」。
1)董明珠喜提「闖紅燈」
橫豎在馬路邊的違章曝光系統(tǒng),相信你我都不陌生,只是日理萬機的格力總裁董明珠肯定沒想到,自己竟然有一天會在系統(tǒng)的大屏幕上出現(xiàn)。
這件「人在家中坐,鍋從天上來」的烏龍事件發(fā)生在寧波的中山東路,當(dāng)時一輛車身印著董明珠海報的公交車在經(jīng)過江夏橋東一帶時,正好被紅燈的違章系統(tǒng)給抓個正著,這張董明珠化名「巨**」的抓拍被曝光后鬧得滿城風(fēng)雨,許多自媒體紛紛對此事進行轉(zhuǎn)載。
事后,寧波交警事后在微博上澄清,表示這套「行人非機動車闖紅燈抓拍系統(tǒng)」是對海報進行了誤識別,同時已經(jīng)對系統(tǒng)進行了升級。
相關(guān)的報道鏈接:
孫啟超:卷積神經(jīng)網(wǎng)絡(luò)在人臉識別技術(shù)中的應(yīng)用 | AI 研習(xí)社第 51 期猿桌會
2)Google Photo 的「驚悚」合成算法
相冊管理系統(tǒng)可以幫助完成哪些任務(wù)?根據(jù)拍攝地點和人臉來歸類照片、將近期拍攝的照片生成小動畫……現(xiàn)在還能通過算法把你變成深山野林里的巨人????
這張驚悚的功能出自 Google Photo,其用戶 Alex Harker 爆料,有一天他與朋友滑雪后拍了幾張風(fēng)景照與合照,結(jié)果這照片存進手機后被 Google Photo 認為是同一框架的內(nèi)容,擅作主張合成了這張驚世駭俗的照片——他的朋友 Matt 被放大數(shù)倍后安插在了樹林的后頭。
他在 Reddit 上分享了這件事情,很快就獲得了超過 188000 個點贊。
然而這張合照也并不是一無是處。癮科技(Engadget)的專家 Steve Dent 就對算法細節(jié)贊賞有加:「它把左邊的樹隱藏起來,并把人物「插在」樹木之后,這一點做得相當(dāng)不錯。它也巧妙地剪掉了人物的上半身,順著斜坡的輪廓,看起來人物的上半身好像藏在山溝里,似乎在告訴朋克滑雪者放慢腳步?!?/p>
相關(guān)的報道鏈接:
DeepMind 新研究:使用強化對抗學(xué)習(xí)合成圖像程序
3)犯口吃的同傳翻譯君
AI 機器翻譯的高速發(fā)展一度讓許多翻譯界人士瑟瑟發(fā)抖,似乎過幾天自己就要被 AI 取而代之,然而 2018 年 4 月份發(fā)生在博鰲亞洲論壇上的 AI 同傳大型翻車事件,也許能讓他們暫時松一口氣。
該同傳產(chǎn)品在當(dāng)時主要負責(zé)為博鰲論壇的開幕式及部分核心論壇提供同聲傳譯支持,其中包括同傳雙語內(nèi)容會議現(xiàn)場投屏、同傳內(nèi)容手機小程序查看、翻譯結(jié)果語音收聽、同傳記錄回放等。結(jié)果會議才開始沒多久,網(wǎng)上就爆出同傳產(chǎn)品「掉鏈子」的消息,其中集中出現(xiàn)的問題分別是「大面積單詞無意義重復(fù)、大小寫及字符混亂」和「中英雙語切換頻率」,比如在一片中文翻譯中出現(xiàn)大量無意義的英文單詞「for」。
事后產(chǎn)品負責(zé)人向媒體表示,產(chǎn)品自然有需要優(yōu)化的地方,然而不可忽略的是,博鰲論壇具有」多國嘉賓同場參與、多種口音、多語自由切換或中英文夾雜,多噪音「等特點,復(fù)雜度很高,對 AI 同傳形成極大挑戰(zhàn)。此外,也有專家表示,業(yè)界這幾年將機器翻譯的水平捧得過高,實際上許多論文中的翻譯成果都要在限定的條件下才能成立,所以才會給大眾形成了極大的心理落差。
相關(guān)的報道鏈接:
4)「特朗普」狂飚十級中文
這是科大訊飛通過自主研發(fā)的語音合成技術(shù)所生成的一段視頻,那位讓中國人民又愛又恨的美國總統(tǒng)特朗普,用字正腔圓的腔調(diào)說出了「科大訊飛真的很棒」等一大段中文句子,在網(wǎng)上引起了熱議。
完整內(nèi)容請從 00:02:43 處看起
相關(guān)的報道鏈接:
一文看懂深度學(xué)習(xí)在語音合成&增強上的應(yīng)用
5)AI 寫了本《哈利·波特與看起來像一大坨灰燼的肖像》新書
本章節(jié)所有圖片皆源自公眾號「英國那些事兒」
一個叫 Botnik 研究室的團隊開發(fā)出了「預(yù)言鍵盤」算法,該算法可以根據(jù)輸入的內(nèi)容來猜測并書寫接下來的文字內(nèi)容。該團隊的研究員們把 7 本《哈利波特》原著全部輸入到算法里頭,然后對它進行訓(xùn)練,最后通過一小段引導(dǎo)文章讓 AI 自己寫出哈利波特新篇——《看起來像一大坨灰燼的肖像》(書名還是 AI 自己取的)。
隨后,Botnik 研究室在推特賬號上放出了新書的第十三章內(nèi)容,結(jié)果全球的哈利波特粉絲都高潮了……
「哈利感覺到伏地魔站在他身后。他感到一陣強烈的過度反應(yīng)。哈利瞬間把自己的眼睛從頭上撕扯下來,丟到森林里。伏地魔對著哈利揚了揚眉毛,不過此刻他當(dāng)然什么都看不見。
『伏地魔,你是一個非常壞、非??瘫〉奈讕??!?哈利蠻橫地說道。赫敏起勁地點著頭?!?/span>
「他們施了一兩個咒語,從食死徒的腦袋上開始迸發(fā)出綠色光芒。羅恩退縮了。
『現(xiàn)在不那么帥氣了?!还贿呄胫贿呌煤彰粽毫苏豪贬u。
食死徒們現(xiàn)在都死了,而哈利像從來沒有過的那樣饑餓。」
諸如此類讓人感到「喪心病狂」的奇思妙想在書中比比皆是,于是網(wǎng)友紛紛奔走相告:
「毫不懷疑,這是我讀過的最好的文章?!?/p>
「我想把整本書都買下來?!?/p>
相關(guān)的報道鏈接:
AI 當(dāng)寫作老師,媽媽再也不用擔(dān)心你的學(xué)習(xí)啦
6)斗圖再沒輸過的 AI 表情包生成器
斯坦福大學(xué)的兩個學(xué)生 Abel L Peirson V 和 Meltem Tolunay 在 CS224n 結(jié)業(yè)論文的選題上另辟蹊蹺,選擇了用深度神經(jīng)網(wǎng)絡(luò)來生成表情包。他們開發(fā)出的系統(tǒng)能夠自動給圖片配上相應(yīng)的文字(表情),同時用戶還能給圖片自定義標(biāo)簽,分類上更加方便。
該系統(tǒng)先使用預(yù)訓(xùn)練的 Inception-v3 網(wǎng)絡(luò)生成一個圖片嵌入,然后將它傳遞到基于 attention 的深層 LSTM 模型中來生成最終注釋,該做法靈感來自于大名鼎鼎的 SHow&Tell 模型,他們還稍微修改了一下集束搜索算法來保證配字的多樣性(罪犯克星烏蠅哥+配字)。他們使用混淆度評估和人類評估來評估他們的模型,評估指標(biāo)主要是兩個,一是生成表情包的質(zhì)量,二是是否可以以假亂真。
最后來看看生成的結(jié)果吧:
相關(guān)的報道鏈接:
昨晚我在斯坦福斗圖輸給了兩個學(xué)生,他們用深度神經(jīng)網(wǎng)絡(luò)生成表情,他們發(fā)圖很快
7)女優(yōu)變臉為哪般
事情首先要追溯到 2017 年的 12 月份,一位名叫 Deepfakes 的 Reddit 用戶利用人工智能將女明星的臉與色情演員進行對調(diào),以滿足私欲。
隨著越來越多人參與到社區(qū)的「建設(shè)」中來,有人開始給軟件添加額外的腳本和附加組件,使視頻的制作變得更加便捷。今年,一名社區(qū)用戶甚至創(chuàng)建了名為 Fakeapp 的應(yīng)用,在 deepfakes 的原始軟件基礎(chǔ)上進行了改進與優(yōu)化,他將下載鏈接發(fā)布到 reddit 的子版塊,并附有詳細的教程,不需要安裝 Python(計算機程序設(shè)計語言)和其他解析代碼就能輕松使用。
雖然有人開始擔(dān)心這些視頻最終可能流向未成年人,給社會造成不良影響,然而由于這些內(nèi)容全是虛構(gòu)的,而且不涉及金錢交易,同時上傳的地點是 reddit 中的 NSFW(Not Safe For Work,涉及色情、暴利內(nèi)容)板塊,因此難以被法律追究責(zé)任。
相關(guān)的報道鏈接:
DeepMind 新研究:使用強化對抗學(xué)習(xí)合成圖像程序
8)比 Taylor Swift 演唱會還要搶手的人工智能頂會門票
全世界都知道人工智能火、機器學(xué)習(xí)火。具體火到了什么程度呢?NIPS2018 的售票情況可以說明一切:一個討論學(xué)術(shù)話題的嚴肅學(xué)術(shù)會議,正會門票 11 分鐘就宣告售罄,比 Taylor Swift 演唱會門票還要搶手!
「從能去 NIPS 2018 到去不了了,可以只差喝一杯咖啡的時間」計算機視覺大牛、特斯拉 AI 總監(jiān) Andrej Karpathy 推特上的發(fā)言,代表了許多 AI 研究人員當(dāng)時內(nèi)心的奔騰。莫斯科物理技術(shù)學(xué)院、深度學(xué)習(xí)研究人員 Sergey Kolesnikov 調(diào)侃道,很快我們將會迎來全新的 NIPS 競賽——2024 NIPS RL Competition: Learning to Register(2024 NIPS 強化學(xué)習(xí)競賽:學(xué)習(xí)如何注冊會議)。
玩笑歸玩笑,許多業(yè)界人士對于這種現(xiàn)狀還是表示了擔(dān)憂。谷歌大腦的 Keras 作者 Fran?ois Chollet 就說,如今頂級會議的參會人員「魚龍混雜」,即便搶到了票,想去的欲望也不是特別強烈。對他而言,去頂級會議的目的是可以見那些平時一直相見的人,而不是為了應(yīng)酬一些閑雜人等。
相關(guān)的報道鏈接:
聽說 NIPS 2018 門票十分鐘賣光,機器學(xué)習(xí)圈子炸了鍋
9)Yann LeCun & Gary Macus 的基情掐架
一位是紐約大學(xué)的著名心理學(xué)、神經(jīng)科學(xué)家,一位是人工智能領(lǐng)域的大牛,Gary Marcus 和 Yann LeCun 在 2018 年年終因為另一名人工智能大牛 Yoshua Bengio 的專訪內(nèi)容,兩人進行了曠日持久的對嗆。
事情起因是 Gary Marcus 認為 Yoshua Bengio 在采訪中的一番講話「我沒有要撇開深度學(xué)習(xí)的意思……但我們應(yīng)該將其擴展,使它能夠推理、學(xué)習(xí)因果關(guān)系、探索世界?!故恰赋u」自己在 2012 年表達過的觀點。隨后 Yann LeCun 懟他空有一張嘴,并未曾為此做過嘗試,更何況該觀點根本不是什么新鮮事,早就已經(jīng)被說爛。兩人在推特上一來一往,探討的內(nèi)容從抄襲變成對深度學(xué)習(xí)話語權(quán)的探討,然而這些都不是重點。
兩人早已不是第一次掐架,從 17 年開始,他們便習(xí)慣于在推特上通過互 @ 的方式來進行「學(xué)術(shù)探討」,一般是 Gary Marcus 在推特上看到和自己觀點一致的推文或者文章,就會轉(zhuǎn)發(fā)后圈 Yann LeCun 讓他表態(tài),LeCun 也樂此不疲,你圈我我就好好跟你理論,儼然一堆人工智能界的「活寶」。
相關(guān)的報道鏈接:
別忽視深度學(xué)習(xí)的種種問題,Gary Marcus 潑冷水義不容辭
10)「AI 研究人員年薪百萬」是一場美麗的誤會
去年年中,紐約時報的記者卡德梅茨爆料了一條令人「震驚」的消息——AI 研究人員年薪百萬(哪怕是在 OpenAI 這樣的非營利機構(gòu)里),個個都是人生贏家。一時間人們以為 AI 研究人員都在過著「水晶香檳拿來洗澡、游艇隨便挑、馬爾代夫買環(huán)礁」的奢侈生活。
CMU 的機器學(xué)習(xí)助理教授 Zachary Chase Lipton 隨后就跳出來「義正言辭」地打破了人們的幻想。他強調(diào),OpenAI 里只有一名「天選之人」拿到了超百萬刀的薪酬,這人便是 Ilya Sutskever——世上最好的 40 歲以下的 ML 研究員,此外,他還是一名研發(fā)總監(jiān)。而作為發(fā)明了生成式對抗網(wǎng)絡(luò)(GAN)、世界上五位最著名的機器學(xué)習(xí)研究人員之一的 Ian Goodfellow,他的年薪才只有 80 萬刀。
他表示,AI 研究人員人人年薪百萬就是一個聳人聽聞的消息。至于其他的研究人員,他表示薪水的確很高,但遠沒有新聞中那么瘋狂——一些有經(jīng)驗的的大概 27.5-30 萬刀,而一些在谷歌和臉書做研發(fā)人員的本科生大概能掙 20 多萬刀。
相關(guān)的報道鏈接:
遍地都是百萬年薪機器學(xué)習(xí)專家?真的假的? 雷鋒網(wǎng) AI 科技評論
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。