丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給楊曉凡
發(fā)送

1

谷歌證明數(shù)據(jù)為王,初創(chuàng)公司們被潑上了一盆冰水

本文作者: 楊曉凡 2017-07-17 23:41
導(dǎo)語(yǔ):在人工智能時(shí)代,海量數(shù)據(jù)的價(jià)值被進(jìn)一步放大,手握大數(shù)據(jù)的大公司就具有了更大的競(jìng)爭(zhēng)優(yōu)勢(shì)

雷鋒網(wǎng) AI 科技評(píng)論按:上周我們報(bào)道了谷歌的一項(xiàng)研究 “數(shù)據(jù)為王”是真的嗎?谷歌輕撫著100倍的數(shù)據(jù)量點(diǎn)了點(diǎn)頭 - 雷鋒網(wǎng),它直觀地體現(xiàn)了更多訓(xùn)練數(shù)據(jù)可以帶來(lái)更好的結(jié)果,但連線(WIRED)的這篇文章就表示了對(duì)這一結(jié)果的擔(dān)憂。雷鋒網(wǎng) AI 科技評(píng)論對(duì)原文編譯如下。

谷歌證明數(shù)據(jù)為王,初創(chuàng)公司們被潑上了一盆冰水

上一周,谷歌又發(fā)布了一項(xiàng)破紀(jì)錄的AI研究,不過(guò)這次的研究結(jié)果是對(duì)目前 AI 商業(yè)化熱潮的一盆冷水。傳統(tǒng)上大家都認(rèn)為科技企業(yè)的生態(tài)系統(tǒng)是靠小公司顛覆大公司、大公司隨之瓦解,從而保持創(chuàng)新和非壟斷的,消費(fèi)者和整個(gè)科技經(jīng)濟(jì)都逐漸變得越來(lái)越依賴這種模式??墒钱?dāng)科技競(jìng)爭(zhēng)的武器成為機(jī)器學(xué)習(xí),而機(jī)器學(xué)習(xí)又需要用海量數(shù)據(jù)訓(xùn)練的時(shí)候,想要正面打敗一個(gè)科技巨頭就會(huì)變得前所未有地難。

這項(xiàng)谷歌與CMU(卡耐基梅隆大學(xué))合作進(jìn)行的圖像識(shí)別研究開(kāi)支非常高,它占用了50個(gè)高性能  GPU整整2個(gè)月的時(shí)間,而且用到的帶標(biāo)簽圖像數(shù)量也達(dá)到了史無(wú)前例的3億張(這個(gè)領(lǐng)域多數(shù)的研究用到的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)大小僅僅是1百萬(wàn)張圖像而已)。這項(xiàng)研究的目的是測(cè)試有沒(méi)有辦法繼續(xù)提升圖像識(shí)別的正確率,尤其不是靠?jī)?yōu)化現(xiàn)有算法,而僅僅靠十倍的、上百倍的數(shù)據(jù)。

實(shí)驗(yàn)結(jié)果是肯定的。在谷歌和CMU的研究人員用嘆為觀止的3億張圖片的新數(shù)據(jù)庫(kù)訓(xùn)練了一個(gè)標(biāo)準(zhǔn)的圖像識(shí)別系統(tǒng)以后,他們表示這個(gè)系統(tǒng)在多項(xiàng)圖像理解測(cè)試中的表現(xiàn)都創(chuàng)下了新高。比如識(shí)別照片中的物體,算法的識(shí)別準(zhǔn)確率和訓(xùn)練所用的數(shù)據(jù)量之間有明顯的正相關(guān)。AI研究界的上空曾經(jīng)盤踞著這個(gè)問(wèn)題,“僅僅靠更多的訓(xùn)練數(shù)據(jù)能否從現(xiàn)有算法壓榨出更多的潛能”,這次谷歌和CMU的研究結(jié)果就可以算是給出了明確的答案。

這種對(duì)于已經(jīng)很多的數(shù)據(jù)還能得到“更多數(shù)據(jù)=更好表現(xiàn)”的結(jié)果提醒了大家,谷歌、Facebook、微軟這樣的擁有大量數(shù)據(jù)的科技巨頭占據(jù)的優(yōu)勢(shì)可能要比之前普遍認(rèn)為的還要大。目前看起來(lái)谷歌的3億張圖片的數(shù)據(jù)庫(kù)帶來(lái)的提升并不算大,訓(xùn)練數(shù)據(jù)從一百萬(wàn)增加到3億也僅僅提升了3%的物體識(shí)別正確率,但是論文作者們表示,他們覺(jué)得可以把軟件部分調(diào)整得更適合超大量的數(shù)據(jù),從而進(jìn)一步擴(kuò)大數(shù)據(jù)量帶來(lái)的優(yōu)勢(shì)。即便最后的結(jié)果沒(méi)有那么理想,科技界中微小的優(yōu)勢(shì)也可能會(huì)帶來(lái)顯著的影響,比如自動(dòng)駕駛汽車的視覺(jué)系統(tǒng)識(shí)別準(zhǔn)確率繼續(xù)提升一點(diǎn)點(diǎn)都舉足輕重,產(chǎn)品的每一點(diǎn)點(diǎn)效率提升也都可以帶來(lái)十幾億的營(yíng)收增長(zhǎng)。

對(duì)于把 AI 作為發(fā)展核心的公司們來(lái)說(shuō),囤積數(shù)據(jù)作為一種防御策略已經(jīng)得到了充分的討論和執(zhí)行。谷歌、微軟等等公司已經(jīng)開(kāi)源了許多軟件甚至硬件設(shè)計(jì),給更多人提供了豐富的工具,但是對(duì)喂給這些工具的數(shù)據(jù)卻是越發(fā)守口如瓶。科技公司確實(shí)會(huì)發(fā)布一些數(shù)據(jù),谷歌去年發(fā)布了一個(gè)來(lái)自7百萬(wàn)個(gè)YouTube視頻的大型數(shù)據(jù)集,Salesforce也發(fā)布了一個(gè)來(lái)自Wikipedia的數(shù)據(jù)集用于讓機(jī)器學(xué)習(xí)模型學(xué)習(xí)人類語(yǔ)言。但是 AI 開(kāi)發(fā)實(shí)驗(yàn)室 Manifold 的合伙人、勞倫斯伯克利國(guó)家級(jí)實(shí)驗(yàn)室的訪問(wèn)學(xué)者 Luke de Oliveira說(shuō),(正如我們所想的那樣)這些公開(kāi)的數(shù)據(jù)對(duì)潛在的競(jìng)爭(zhēng)者來(lái)說(shuō)往往沒(méi)有多少價(jià)值?!澳切?huì)影響自家產(chǎn)品保持市場(chǎng)地位的關(guān)鍵數(shù)據(jù),他們是永遠(yuǎn)也不會(huì)公開(kāi)的”,他說(shuō)。

谷歌和CMU的研究者確實(shí)表示他們希望這項(xiàng)對(duì)于海量數(shù)據(jù)價(jià)值的研究可以催生出跟谷歌的數(shù)據(jù)規(guī)模類似的超大規(guī)模開(kāi)源圖像數(shù)據(jù)集?!拔覀冇芍缘叵M@項(xiàng)研究可以激勵(lì)視覺(jué)研究社區(qū)重視數(shù)據(jù)的重要性,并且集合多方力量建立更大的數(shù)據(jù)集”,他們寫道。CMU的 Abhinav Gupta也參與了這項(xiàng)研究,他說(shuō)有一種方法是與通用視覺(jué)數(shù)據(jù)基金會(huì)(Common Visual Data Foundation)合作;這是一家由Facebook和微軟發(fā)起的非營(yíng)利機(jī)構(gòu),它就已經(jīng)發(fā)布過(guò)一些開(kāi)源圖片數(shù)據(jù)集。

與此同時(shí),手中數(shù)據(jù)少的公司如果想在數(shù)據(jù)的“富人”能靠數(shù)據(jù)變得更聰明的世界中生存下來(lái),得自己變得有創(chuàng)意一點(diǎn)。初創(chuàng)公司DataRobot的CEO Jeremy Achin就猜測(cè)小公司們之間可能會(huì)共享數(shù)據(jù)來(lái)讓他們的風(fēng)險(xiǎn)預(yù)測(cè)能力可以與體量大的競(jìng)爭(zhēng)對(duì)手匹敵。這種做法以前在保險(xiǎn)業(yè)中見(jiàn)過(guò),未來(lái)可能變得越來(lái)越普遍,因?yàn)闄C(jī)器學(xué)習(xí)已經(jīng)在越來(lái)越多的各界企業(yè)中展現(xiàn)了它的重要性。

未來(lái)機(jī)器學(xué)習(xí)的發(fā)展如果能夠降低對(duì)數(shù)據(jù)量的需求,是有可能顛覆當(dāng)下 AI 的“數(shù)據(jù)”生態(tài)的,Uber去年就收購(gòu)了一家做這方面研究的公司。不過(guò)即便現(xiàn)在也可以嘗試回避局內(nèi) AI 玩家的常見(jiàn)數(shù)據(jù)優(yōu)勢(shì)。一家研究如何提高機(jī)器學(xué)習(xí)易用性的公司 Fast.ai 的聯(lián)合創(chuàng)始人 Rachel Thomas 說(shuō),初創(chuàng)公司可以另辟戰(zhàn)場(chǎng),在互聯(lián)網(wǎng)巨頭的視野之外尋找機(jī)器學(xué)習(xí)的應(yīng)用場(chǎng)景從中獲利,比如農(nóng)業(yè)方面?!拔矣X(jué)得這些大公司不見(jiàn)得在每個(gè)地方都有很大的優(yōu)勢(shì),其實(shí)許多特定領(lǐng)域內(nèi)的數(shù)據(jù)根本就沒(méi)人收集”,她說(shuō)。在她看來(lái)即便是人工智能的巨頭也會(huì)有盲點(diǎn)。

相關(guān)文章:

中科視拓CTO山世光:如何用X數(shù)據(jù)驅(qū)動(dòng)AI成長(zhǎng)? | CCF-GAIR 2017

菜鳥網(wǎng)絡(luò)算法專家朱禮君:物流優(yōu)化問(wèn)題在大數(shù)據(jù)時(shí)代被賦予新的意義? | CCF-GAIR 2017

“數(shù)據(jù)為王”是真的嗎?谷歌輕撫著100倍的數(shù)據(jù)量點(diǎn)了點(diǎn)頭

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

谷歌證明數(shù)據(jù)為王,初創(chuàng)公司們被潑上了一盆冰水

分享:
相關(guān)文章

讀論文為生

日常笑點(diǎn)滴,學(xué)術(shù)死腦筋
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)