丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李詩
發(fā)送

0

專訪天壤智能創(chuàng)始團(tuán)隊(duì):深度強(qiáng)化學(xué)習(xí)如何落地圍棋、營銷等多個(gè)領(lǐng)域

本文作者: 李詩 2018-06-01 18:44
導(dǎo)語:5月26日,又一位世界圍棋冠軍敗給了AI。

5月26日,又一位世界圍棋冠軍敗給了AI。不過與其對(duì)戰(zhàn)的不是接連擊敗李世石和柯潔的AlphaGo,而是國內(nèi)創(chuàng)業(yè)公司天壤智能的圍棋AI。

在杭州云棲小鎮(zhèn)的2050大會(huì)上,天壤智能舉辦了一場(chǎng)“天壤AI圍棋論道世界冠軍人機(jī)表演賽”,天壤智能的AI圍棋執(zhí)白子對(duì)戰(zhàn)韓國圍棋第一人、獲得三次世界冠軍的樸廷桓,激戰(zhàn)三小時(shí)后,最終樸廷桓認(rèn)負(fù)。

據(jù)天壤智能介紹,圍棋AI是其人工智能平臺(tái)的實(shí)驗(yàn)性項(xiàng)目,在人工智能圍棋對(duì)弈上,天壤圍棋已經(jīng)進(jìn)入除了AlphaGo的圍棋人工智能第一集團(tuán)。目前,通過以AI圍棋積累的深度強(qiáng)化學(xué)習(xí)技術(shù),天壤智能正在搭建通用人工智能平臺(tái),為營銷、交通、金融等領(lǐng)域提供高效精準(zhǔn)的AI服務(wù)。

在2050大會(huì)現(xiàn)場(chǎng),雷鋒網(wǎng)與天壤智能CEO薛貴榮、CTO張雷和COO韓定一進(jìn)行了深度交流,除了AI圍棋外,深入了解了其在AI廣告營銷的落地場(chǎng)景。

專訪天壤智能創(chuàng)始團(tuán)隊(duì):深度強(qiáng)化學(xué)習(xí)如何落地圍棋、營銷等多個(gè)領(lǐng)域

天壤團(tuán)隊(duì)與世界圍棋冠軍樸廷桓的合影

(2016年,薛貴榮(右六)創(chuàng)辦了天壤智能,在此前,薛貴榮是阿里巴巴旗下阿里媽媽大數(shù)據(jù)中心負(fù)責(zé)人、阿里媽媽首席數(shù)據(jù)科學(xué)家,負(fù)責(zé)研發(fā)了阿里搜索引擎(神馬搜索)、數(shù)據(jù)管理平臺(tái)、營銷技術(shù)平臺(tái)等。COO韓定一(右二)是原阿里巴巴旗下阿里媽媽鉆石展位、達(dá)摩技術(shù)負(fù)責(zé)人,在阿里任職期間先后負(fù)責(zé)研發(fā)了全網(wǎng)用戶行為分析平臺(tái)、云搜索、鉆石展位、達(dá)摩平臺(tái)。CTO張雷(右三)曾在百度搜索廣告部門任主任架構(gòu)師,曾任IBM中國研究院高級(jí)研究員且領(lǐng)導(dǎo)了IBM DeepQA開放問答系統(tǒng)中國團(tuán)隊(duì)的技術(shù)工作。)

深耕AI圍棋,掌握核心技術(shù)

2016年,薛貴榮從阿里離職,創(chuàng)辦天壤智能,主要的業(yè)務(wù)是精準(zhǔn)廣告營銷。當(dāng)時(shí)正值A(chǔ)lphaGo大殺四方,AlphaGo背后的深度強(qiáng)化學(xué)習(xí)技術(shù)吸引了天壤的注意,在天壤看來除了圍棋外,深度強(qiáng)化學(xué)習(xí)還能有更多的應(yīng)用領(lǐng)域。

張雷告訴雷鋒網(wǎng),現(xiàn)在的AI主要分為兩類,一是感知類的AI,例如人臉識(shí)別、語音識(shí)別,還有一種是在感知的基礎(chǔ)上做決策,通過深度強(qiáng)化學(xué)習(xí)技術(shù)來做。天壤智能成立時(shí),感知AI領(lǐng)域已經(jīng)有不少做得不錯(cuò)的公司,他們就想做更往前一步的決策AI,圍棋就是最好的例子,需要在感知的基礎(chǔ)上去做決策。

天壤智能一頭扎入了AlphaGo論文中,薛貴榮談到,很多公司可能就是看看論文直接學(xué)習(xí)技術(shù),但是他覺得不親自做一遍根本就不知道這個(gè)技術(shù)可能還有其他什么解決方法,不知道如何去將這個(gè)技術(shù)調(diào)整應(yīng)用在別的領(lǐng)域。因此,天壤從零開始開發(fā)天壤智能AI圍棋。

與同樣在探索深度強(qiáng)化學(xué)習(xí)技術(shù)的DeepMind等科技巨頭相比,天壤作為一家成立僅兩年的創(chuàng)業(yè)公司,在算力上完全沒有與科技巨頭媲美的資源,而深度強(qiáng)化學(xué)習(xí)又是一項(xiàng)對(duì)計(jì)算資源消耗極大的技術(shù),天壤從系統(tǒng)、策略上進(jìn)行了獨(dú)有的創(chuàng)新。

據(jù)介紹,在系統(tǒng)維度,天壤基于Berkeley Ray搭建了大規(guī)模分布式深度強(qiáng)化學(xué)習(xí)平臺(tái)天云,實(shí)現(xiàn)了大規(guī)模GPU上的模擬、訓(xùn)練、模型迭代更新、參數(shù)自動(dòng)調(diào)優(yōu)等。從策略上,天壤通過創(chuàng)新型的伴隨訓(xùn)練的方式,搭建漸進(jìn)式的加深網(wǎng)絡(luò),先從小網(wǎng)絡(luò)開始訓(xùn)練模型,再逐步切換到更大的網(wǎng)絡(luò)。在更快的迭代速度下,實(shí)現(xiàn)非常深的神經(jīng)網(wǎng)絡(luò)訓(xùn)練。薛貴榮談到,“在系統(tǒng)和策略上的技術(shù)突破,是天壤訓(xùn)練出能夠擊敗世界圍棋冠軍、躋身全球圍棋AI第一集團(tuán)的秘訣”。

當(dāng)然,在AlphaGo之后涌現(xiàn)出的人工智能圍棋程序還包括:日本的DeepZenGo、騰訊的絕藝、神算子、先知圍棋等。這些人工智能圍棋程序也曾多次一較高下:2017年8月,在第一屆“中信證券”杯世界智能圍棋公開賽上,天壤智能與騰訊絕藝、日本DeepZenGo和臺(tái)灣的CGI一起殺入四強(qiáng)。2017年12月,在第一屆圍棋AI龍星戰(zhàn)中,天壤獲得第三名,排在絕藝、DeepZenGo之后。而目前,據(jù)薛貴榮介紹,天壤智能AI圍棋已經(jīng)僅次于AlphaGo,就在即將到來的六月,還會(huì)與騰訊絕藝一較高下。

人工智能圍棋程序令人向往,除了世界冠軍外,不少人也希望能夠有機(jī)會(huì)與其較量,但是由于人工智能圍棋程序需要大量的硬件、算力支持,一次人機(jī)對(duì)戰(zhàn)的成本就很高。而在此次與樸廷桓的對(duì)戰(zhàn)中,天壤智能只使用了英特爾通用CPU平臺(tái),而不是通常的GPU平臺(tái),據(jù)稱,英特爾為此次人機(jī)圍棋對(duì)戰(zhàn)提供了有力的技術(shù)支持。

薛貴榮告訴雷鋒網(wǎng),目前天壤智能將圍棋AI開放給公眾,在網(wǎng)站上任何人都可以跟職業(yè)九段等級(jí)的圍棋AI進(jìn)行對(duì)弈。天壤智能也與棋院達(dá)成合作,用圍棋AI給棋手陪練。

AI賦能廣告投放決策

通過圍棋AI,天壤掌握了深度強(qiáng)化學(xué)習(xí),并且將其落地不同的應(yīng)用場(chǎng)景。第一個(gè)場(chǎng)景就是他們團(tuán)隊(duì)最熟悉的廣告營銷領(lǐng)域。在天壤看來,營銷投放與圍棋對(duì)弈類似,本質(zhì)是動(dòng)態(tài)環(huán)境復(fù)雜組合空間的實(shí)時(shí)決策。

在互聯(lián)網(wǎng)時(shí)代,廣告主投放網(wǎng)絡(luò)廣告的主要手段是程序化廣告平臺(tái)(包括DSP、SSP等),騰訊的廣點(diǎn)通、阿里的鉆石展位是典型的程序化廣告平臺(tái)。天壤創(chuàng)始人兼CEO薛貴榮曾負(fù)責(zé)阿里媽媽的大數(shù)據(jù)營銷技術(shù)平臺(tái),COO韓定一是阿里媽媽鉆石展位、達(dá)摩盤技術(shù)負(fù)責(zé)人,他們對(duì)程序化廣告有十分深入的了解。

韓定一告訴雷鋒網(wǎng),程序化廣告實(shí)現(xiàn)了一定程度的自動(dòng)化和精準(zhǔn)的廣告投放,但是很多事情依然需要依靠人力,例如媒介投放人員需要在上千的分類標(biāo)簽中選定自己的目標(biāo)對(duì)象、需要選擇投放的地域時(shí)段、需要給出廣告競(jìng)價(jià),此外,還需要根據(jù)每一次投放的數(shù)據(jù)反饋來調(diào)整下一次的投放策略,分析如何投放才能提升效果。在天壤看來,雖然現(xiàn)在互聯(lián)網(wǎng)產(chǎn)生了眾多的數(shù)據(jù),但是廣告主和廣告投放人員依然無法有效地利用數(shù)據(jù)。

天壤利用深度強(qiáng)化學(xué)習(xí)技術(shù),在程序化廣告平臺(tái)的基礎(chǔ)上推出了“天壤營銷大腦”,它在客戶的商業(yè)需求和廣告平臺(tái)之間建立了一個(gè)商業(yè)邏輯。利用“營銷大腦”,廣告主只需要進(jìn)行簡(jiǎn)單的操作,告訴平臺(tái)媒介投放的基本商業(yè)邏輯:活動(dòng)是針對(duì)新客戶還是老客戶、希望吸引多少量、投入的資金多少。然后,“營銷大腦”能根據(jù)大數(shù)據(jù)自動(dòng)為客戶去挑選目標(biāo)人群、制定投放地域時(shí)段、廣告競(jìng)價(jià),然后不斷實(shí)時(shí)調(diào)整以達(dá)到最好的投放效果。

在2017年雙11期間,天壤智能的“營銷大腦”就已經(jīng)投入使用。雙11活動(dòng)期間,天鉆總共幫助商家完成7213萬的鉆展投放預(yù)算,促成雙11當(dāng)天總成交13.58億。其效果也有明顯提升, 商戶的獲客成本下降56%、ROI平均提升78%。

據(jù)介紹,AI機(jī)器人為每個(gè)商家每天提供決策34560次,平均每2.5秒一次,同時(shí)每個(gè)商家每天進(jìn)行2000次的調(diào)整,平均每43.2秒一次。在程序化廣告投放中,每一次決策都將引發(fā)對(duì)最終獲得營銷結(jié)果的影響。加上競(jìng)價(jià)環(huán)境的變化,需要不斷調(diào)整才能獲得最優(yōu),隨著人工智能技術(shù)的發(fā)展,機(jī)器決策將成為更適合營銷投放的一種方式。

在韓定一看來,目前廣告投放人員的重復(fù)性工作很多也很機(jī)械,這些投放和數(shù)據(jù)分析的工作交給AI去做可以解放廣告投放人員,他們可以去負(fù)責(zé)更多與客戶需求、廣告創(chuàng)意相關(guān)的工作,進(jìn)一步提升營銷效果。

我們離通用人工智能還有多遠(yuǎn)?

AI圍棋、AI廣告營銷都是天壤將深度強(qiáng)化學(xué)習(xí)技術(shù)落地的應(yīng)用場(chǎng)景,天壤還在探索AI在交通信號(hào)燈控制、金融量化投資上的應(yīng)用,而他們的長(zhǎng)遠(yuǎn)規(guī)劃是打造人工智能通用平臺(tái),以AI技術(shù)賦能更多的行業(yè)和場(chǎng)景。 

近兩年,AI發(fā)展迅猛,正在改變各個(gè)傳統(tǒng)行業(yè)。然而目前的AI技術(shù)大多是在計(jì)算機(jī)視覺、自然語言處理、語音技術(shù)的單點(diǎn)突破,這些感知類的技術(shù)的進(jìn)步建立在大量的人工標(biāo)注數(shù)據(jù)之上,而當(dāng)很多場(chǎng)景需要AI去做決策的時(shí)候,并沒有這樣的數(shù)據(jù)可以使用。

通用人工智能主要有兩個(gè)特點(diǎn),一是端對(duì)端(end-to-end)的學(xué)習(xí),二是任務(wù)自適應(yīng), 無需人類調(diào)參而勝任不同的任務(wù)。DeepMind的AlphaGo讓大家看到了深度強(qiáng)化學(xué)習(xí)技術(shù)打造通用人工智能平臺(tái)的希望。

張雷告訴雷鋒網(wǎng),“現(xiàn)在的深度強(qiáng)化學(xué)習(xí)技術(shù)的狀態(tài)跟6年前深度學(xué)習(xí)很像。2012的時(shí)候,深度學(xué)習(xí)技術(shù)剛剛成熟,使得圖像識(shí)別準(zhǔn)確率突然取得了一個(gè)很大的提高,很多人投入其中,準(zhǔn)確率越做越高。目前,深度強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用到圍棋領(lǐng)域,擊敗人類冠軍是一個(gè)標(biāo)志性的突破,吸引很多人來做,未來應(yīng)該會(huì)有更多的突破?!?/strong>

 

相關(guān)文章:

呵,我復(fù)現(xiàn)一篇深度強(qiáng)化學(xué)習(xí)論文容易嗎

這里有一篇深度強(qiáng)化學(xué)習(xí)勸退文

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:

編輯

關(guān)注AI業(yè)界、NLP、VR、AR技術(shù)與產(chǎn)品。采訪報(bào)道、行業(yè)交流請(qǐng)加微信“Hanass”
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄