丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給楊鯉萍
發(fā)送

0

競技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母偁幜?

本文作者: 楊鯉萍 2019-09-26 18:22
導(dǎo)語:怎樣才能在大數(shù)據(jù)時代浪潮,翻出最美浪花

雷鋒網(wǎng) AI 開發(fā)者按:09 月 21 日,CCF TF 第 22 期「數(shù)據(jù)驅(qū)動」主題會議順利舉辦。本次會議主席由競技世界首席數(shù)據(jù)科學(xué)家巴川擔(dān)任,會議特別邀請了來自學(xué)界與業(yè)界的多位大咖共同探討數(shù)據(jù)驅(qū)動技術(shù)在生活與生產(chǎn)中的應(yīng)用與價值。特邀嘉賓包括:清華大學(xué)計算機系教授兼軟件所所長李國良、河北省大數(shù)據(jù)計算重點實驗室副主任劉晶、京東數(shù)科智能城市事業(yè)部數(shù)據(jù)管理平臺部負(fù)責(zé)人鮑捷、滴滴出行高級數(shù)據(jù)科學(xué)家繆瑩瑩以及餓了么研究員傅周宇。

大數(shù)據(jù)時代已經(jīng)到來,針對當(dāng)下 AI 與數(shù)據(jù)驅(qū)動的痛難點和未來發(fā)展趨勢,會議細(xì)節(jié)設(shè)置部署,以及對數(shù)據(jù)驅(qū)動相關(guān) AI 學(xué)術(shù)青年的發(fā)展方向,雷鋒網(wǎng) AI 開發(fā)者獨家訪問了巴川主席,并在不改變原意的情況下,將采訪內(nèi)容整理如下。

競技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母偁幜?  src=

巴川,資深數(shù)據(jù)科學(xué)家

曾就職于中國搜索、搜狐暢游等,主要從事互聯(lián)網(wǎng)數(shù)據(jù)挖掘,現(xiàn)任競技世界(北京)網(wǎng)絡(luò)技術(shù)有限公司首席數(shù)據(jù)科學(xué)家

主要研究領(lǐng)域包括互聯(lián)網(wǎng)用戶行為挖掘、產(chǎn)品運營分析、社交網(wǎng)絡(luò)挖掘、反作弊、風(fēng)控體系、推薦系統(tǒng)、數(shù)據(jù)可視化等

數(shù)據(jù)、技術(shù),誰主浮沉

AI 開發(fā)者:作為一名資深數(shù)據(jù)科學(xué)家,你認(rèn)為數(shù)據(jù)的核心價值在哪里?

巴川:現(xiàn)在的數(shù)據(jù)技術(shù)發(fā)展于社會的意義遠(yuǎn)遠(yuǎn)大于其商業(yè)價值。數(shù)據(jù)工作本身是在大數(shù)據(jù)中尋找數(shù)據(jù)背后的數(shù)學(xué)規(guī)律,而對數(shù)學(xué)規(guī)律的掌握將是社會變革的重要動力,它可能促進(jìn)整個社會的發(fā)展;尤其在當(dāng)下世界格局競爭激烈的時候,大數(shù)據(jù)的挖掘與研究將很有可能成為民族的核心競爭力。

AI 開發(fā)者:對數(shù)據(jù)挖掘與處理的難點又主要體現(xiàn)在哪些方面?

巴川:數(shù)據(jù)挖掘與處理難點主要在數(shù)據(jù)獲取階段。

一方面在于數(shù)據(jù)本身,如果你獲得的數(shù)據(jù)質(zhì)量較差,得到的結(jié)果也不會太好。因此數(shù)據(jù)獲取的全面性和質(zhì)量將對于研究結(jié)果有很大的影響。而關(guān)于用戶隱私問題,則是數(shù)據(jù)獲取難的另一原因。因為數(shù)據(jù)獲取可能會侵犯到他人的隱私,所以在數(shù)據(jù)的使用過程中,我們需要小心謹(jǐn)慎的對待數(shù)據(jù),通常我們也會進(jìn)行一定的脫敏操作,盡可能在保護用戶隱私和給用戶提供便利之間找一個平衡點。

因此總體來講,怎樣能夠既便捷又規(guī)范的獲取質(zhì)量較高的數(shù)據(jù),這個是我們在數(shù)據(jù)獲取中需要重點解決的難題。

AI 開發(fā)者:目前,深度學(xué)習(xí)的結(jié)果很依賴于數(shù)據(jù),你認(rèn)為可以從哪些方面實現(xiàn)改進(jìn)與突破呢?

巴川:通常來講,研究人員利用數(shù)據(jù)進(jìn)行深度學(xué)習(xí)的過程中主要用到了神經(jīng)網(wǎng)絡(luò)技術(shù),而神經(jīng)網(wǎng)絡(luò)具有可驗證不可解釋的特點。因此,從技術(shù)角度來看,研究神經(jīng)網(wǎng)絡(luò)等相關(guān)技術(shù)的可解釋性,可能會是一個很好的突破點。一旦算法可解釋性變強,它對數(shù)據(jù)的依賴就會大大降低。

不過,如果想得到更好的結(jié)果,仍然需要數(shù)據(jù)的「質(zhì)」和「量」進(jìn)行輔助。只有數(shù)據(jù)與算法兩者綜合發(fā)展,才能得到更準(zhǔn)確更完美的結(jié)果。

AI 開發(fā)者:那在你看來,技術(shù)與數(shù)據(jù)之間是一種什么樣的關(guān)系?

巴川:兩者的關(guān)系總體上可以概括為「技術(shù)的發(fā)展有賴于好的數(shù)據(jù),數(shù)據(jù)本身的獲取和價值挖掘也有賴于技術(shù)的發(fā)展,兩者就好比廚師與食材的關(guān)系」。當(dāng)然,兩者的發(fā)展都有一個共同的目的,即幫助我們改善生活和生產(chǎn)。

AI 開發(fā)者:數(shù)據(jù)驅(qū)動目前主要都應(yīng)用在哪些方面?這些領(lǐng)域的發(fā)展是怎樣的呢?

巴川:數(shù)據(jù)技術(shù)與 AI 的發(fā)展,在行業(yè)里的表現(xiàn)基本是一個輪動的狀態(tài)。例如:互聯(lián)網(wǎng)領(lǐng)域現(xiàn)在的發(fā)展雖然可達(dá)八九十分,但它依舊在爆發(fā)式增長,其中很大原因是由于互聯(lián)網(wǎng)產(chǎn)品傳播效果好,所以有些應(yīng)用能直擊用戶癢點時就會產(chǎn)生病毒式傳播。而金融、電信、政務(wù)等行業(yè)的數(shù)據(jù)技術(shù)應(yīng)用,在國家的大力推動下,發(fā)展比較穩(wěn)健,僅次于互聯(lián)網(wǎng)。至于另外一些傳統(tǒng)行業(yè),它們的數(shù)據(jù)盡管還沒能得到很好的開發(fā),相對于前幾個行業(yè)可能有所滯后,但這也將會是未來發(fā)展的目標(biāo)之一。

競技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母偁幜?  src=

圖 1 競技世界首席數(shù)據(jù)科學(xué)家巴川老師 CCF TF 大會演講現(xiàn)場

AI 開發(fā)者:在你所說的輪動領(lǐng)域里面,你比較看好哪個領(lǐng)域?

巴川:目前以及未來三年內(nèi),我覺得最熱的可能還是能直接刺激人們生活的領(lǐng)域,即與互聯(lián)網(wǎng)相關(guān)的行業(yè)。然后可能是金融,金融科技領(lǐng)域這幾年已經(jīng)蠢蠢欲動,也許它將成為數(shù)據(jù)驅(qū)動未來的黑馬之一。而對于傳統(tǒng)行業(yè)的升級改造,有很多的前期準(zhǔn)備工作要做,可能需要一定的時間,才能使得數(shù)據(jù)驅(qū)動技術(shù)在這些行業(yè)得到較快的發(fā)展。

AI 開發(fā)者:我們知道競技世界在做游戲方面也非常厲害,你認(rèn)為數(shù)據(jù)驅(qū)動和游戲之間的關(guān)系是怎樣的呢?

巴川:競技世界主要是一個互聯(lián)網(wǎng)平臺,已擁有超過 5 個億的足夠大的用戶量,使得跟數(shù)據(jù)相關(guān)的技術(shù)更易于推進(jìn)。通過對大量數(shù)據(jù)的分析,我們可以非常直觀的去解決很多問題,包括:在游戲發(fā)行階段怎么樣去獲客,在運營階段怎么樣去促活以及怎么樣最大化創(chuàng)收等。因此,數(shù)據(jù)驅(qū)動和游戲之間有著越來越緊密的聯(lián)系。

洞見 AI 之未來

AI 開發(fā)者:大數(shù)據(jù)、機器學(xué)習(xí)、AI 相關(guān)的概念,近年來越來越火熱,你如何看待近幾年 AI 領(lǐng)域的快速增長?

巴川:總體上,我把大數(shù)據(jù)、機器學(xué)習(xí)、AI 都理解為關(guān)于數(shù)據(jù)的技術(shù)。這些技術(shù)通過利用數(shù)據(jù)來模仿人類的一些行為,從而改善我們的生活和生產(chǎn)。

因此,所謂的爆發(fā)式增長,更多的是應(yīng)用領(lǐng)域,這屬于順應(yīng)時代發(fā)展與需求的一種現(xiàn)象。而究其根本,這一現(xiàn)象主要是得益于算力的增長,即計算機硬件的發(fā)展在 AI 技術(shù)的爆發(fā)式增長方面起著極其重要的作用。

AI 開發(fā)者:那么,你認(rèn)為目前技術(shù)突破的主要難點在哪呢?

巴川:技術(shù)的發(fā)展與算法革新有很大的關(guān)系,而技術(shù)突破的難點也主要在于算法方面。

通常,底層的算法更偏數(shù)學(xué)化,需要更嚴(yán)謹(jǐn)更強大的理論支撐進(jìn)行驗證說明,相對于應(yīng)用方面,理論發(fā)展則非常緩慢,往往一個革命性算法的誕生,可能需要十幾年,甚至幾十年。

AI 開發(fā)者:面對當(dāng)下大力發(fā)展應(yīng)用而較少人專心投入技術(shù)研究的現(xiàn)狀,你是怎么看待其中利弊的呢?

巴川:總體來看,現(xiàn)在是一個良性的階段。

應(yīng)用的大力發(fā)展本身會帶來一定的利益驅(qū)動,以及整體社會的關(guān)注度。在這樣的大環(huán)境下,技術(shù)的發(fā)展自然能夠得到很大推動力量,進(jìn)而促使理論研究的人力投入增加,最終帶動技術(shù)的發(fā)展。所以,我們也無須過分關(guān)注當(dāng)下,時間或許能證明一切。

AI 開發(fā)者:目前,哪些行業(yè)在 AI 的應(yīng)用中受益比較大呢?

巴川:從企業(yè)的角度來看,勞動密集型、重復(fù)性勞動較多的企業(yè)受益會比較大,因為用機器替代人可以節(jié)省很大的勞力成本,比如:客服機器人、工業(yè)機器人等。

而從人的角度來看,受益較大的是原來從事跟數(shù)據(jù)技術(shù)相關(guān)的崗位,比如:做 AI、做大數(shù)據(jù)、做深度學(xué)習(xí)方面的人才。

AI 開發(fā)者:時下深度學(xué)習(xí)也是非常火熱的領(lǐng)域之一,那你認(rèn)為 AI 的下一波爆發(fā)高潮會是什么時候,或者在怎樣的契機下產(chǎn)生呢?

巴川:無論是機器學(xué)習(xí),還是深度學(xué)習(xí)、遷移學(xué)習(xí)、強化學(xué)習(xí)等,這些名詞都不是最重要的,它們只是隨著各種新技術(shù)而產(chǎn)生的代號。因此,如果從宏觀層面來談爆發(fā)高潮的話,這些數(shù)據(jù)技術(shù)一直都處于爆發(fā)式增長的高潮之中,并且這樣的狀態(tài)還將持續(xù)至少 3-5 年。

AI 開發(fā)者:那你認(rèn)為 AI 應(yīng)用開發(fā)的未來發(fā)展趨勢是怎樣的呢?

巴川:現(xiàn)在 AI 的應(yīng)用主要集中在互聯(lián)網(wǎng)行業(yè),但很多傳統(tǒng)行業(yè),比如:礦產(chǎn)、化工等行業(yè),AI 技術(shù)應(yīng)用得很少。

總體來看,如果 AI 應(yīng)用在互聯(lián)網(wǎng)方面的開發(fā)能夠達(dá)到八九十分,可能金融、政務(wù)能達(dá)到六十多分,而一些傳統(tǒng)行業(yè)可能還處于三四十分甚至更低的不及格階段。但往往新的領(lǐng)域,會有更強的爆發(fā)力,所以我認(rèn)為 AI 未來的發(fā)展總體上會是一個版塊輪動的狀態(tài)。

數(shù)據(jù)科學(xué)家的神秘面紗

AI 開發(fā)者:作為本次 CCF TF 會議的召集人,整個議程的設(shè)置,包括選題、嘉賓的邀請你是出于怎樣的考量呢?

巴川:這次請的嘉賓既有學(xué)術(shù)界的大牛,也有企業(yè)界的大咖,這正和 CCF TF 的宗旨與口號——「只為技術(shù)專家」相契合。

特邀嘉賓包括學(xué)術(shù)界的清華李國良教授、河北工業(yè)大學(xué)劉靜教授,企業(yè)界的滴滴、餓了么、京東知名互聯(lián)網(wǎng)企業(yè)里的數(shù)據(jù)專家。因此,本次大會我們主要希望能夠進(jìn)一步促進(jìn)產(chǎn)學(xué)融合,增加產(chǎn)學(xué)互動交流。

而在議題方面,我們既有「數(shù)據(jù)驅(qū)動生活」又有「數(shù)據(jù)驅(qū)動生產(chǎn)」主題。其中李國良教授講的題為「AI 原生數(shù)據(jù)庫」,看似跟數(shù)據(jù)驅(qū)動關(guān)系不大,但對于數(shù)據(jù)庫的管理員來說,對數(shù)據(jù)庫的優(yōu)化也屬于數(shù)據(jù)驅(qū)動的重點內(nèi)容。而劉晶教授的議題是數(shù)據(jù)驅(qū)動傳統(tǒng)行業(yè)的升級改造。滴滴、餓了么、京東的議題則是用數(shù)據(jù)驅(qū)動改善我們的生活。

總體來講,本次會議中我們既有數(shù)據(jù)驅(qū)動生活,又有數(shù)據(jù)驅(qū)動生產(chǎn),還包含了數(shù)據(jù)庫系統(tǒng)優(yōu)化,這是一場討論較為全面的數(shù)據(jù)驅(qū)動主題大會。

競技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母偁幜?  src=

圖 2 CCF TF 「數(shù)據(jù)驅(qū)動」圓桌會議現(xiàn)場

AI 開發(fā)者:具備哪些能力的人,更有可能成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家?

巴川:我一直都帶著既嚴(yán)謹(jǐn)負(fù)責(zé)的態(tài)度對待數(shù)據(jù)又樂觀活潑的心態(tài)去使用數(shù)據(jù)。這不僅能夠保證結(jié)果的合理性和嚴(yán)肅性,還能幫助你獲得一些非常有價值的出乎意料的結(jié)果。

同時,數(shù)學(xué)和編程都是數(shù)據(jù)科學(xué)中很重要的內(nèi)容。數(shù)學(xué)基礎(chǔ)常常能夠決定你將來走多高、多遠(yuǎn);而編程能力則能夠更直接的實現(xiàn)創(chuàng)意。在很多數(shù)據(jù)技術(shù)全面開發(fā)時,通過動手能力和編程能力去實踐自己的想法,尤其是快速實現(xiàn)自己的想法,可能會讓你很大程度上受益。

AI 開發(fā)者:我們都知道,除了數(shù)據(jù)科學(xué)家的身份之外,你還是眾多名校的老師,你是怎么處理這兩個身份之間的關(guān)系呢?

巴川:用四個字概括,即教學(xué)相長。

一方面,我在企業(yè)做數(shù)據(jù)科學(xué)時會積累很多項目經(jīng)驗,將這些經(jīng)驗傳授給學(xué)生的過程本身就是很快樂的。而另一方面,于我而言,學(xué)生給我的啟發(fā)以及眼界上的拓寬也讓我受益頗豐。這既是一個教學(xué)的過程又是一個同行交流的過程,所以我可能在一個學(xué)期內(nèi),教給他們十幾種算法和案例,他們則每個組反饋給我一個案例,進(jìn)而增加我的案例庫,在這一過程中,我也得到了很快的成長。

AI 開發(fā)者:對于 AI 開發(fā)者或者 AI 專業(yè)的學(xué)生,你有什么想要傳達(dá)給他們嗎?

巴川:成功其實是必然和偶然的結(jié)合。少一點功利心,多一點童心,報著好奇的探索欲去看待這個世界,再將自己的技術(shù)運用到該用之處,你就很有可能在大數(shù)據(jù)浪潮中,翻出屬于自己的浪花。有時候,盡管新潮是很大的誘惑,但是只有既保持對這個行業(yè)的嚴(yán)肅性,同時又保持自己的初心,才能愈發(fā)長遠(yuǎn)地發(fā)展下去。

雷鋒網(wǎng) AI 開發(fā)者 雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

競技世界首席數(shù)據(jù)科學(xué)家巴川:數(shù)據(jù)科學(xué),未來或?qū)⒊蔀槊褡搴诵母偁幜? src=

分享:
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說