1
本文作者: 章敏 | 2016-09-01 18:11 |
大數(shù)據(jù)這個(gè)詞我們聽得太多了,可是很少有人意識(shí)到,隨著互聯(lián)網(wǎng)的發(fā)展,今時(shí)今日的這些“大”字究竟已經(jīng)意味著一種什么樣的量級(jí)。除去少數(shù)嘩眾取寵的使用這個(gè)詞的公司外,那些真正擁有大數(shù)據(jù)的企業(yè),經(jīng)手和處理的都是一些普通人可能窮極一生也接觸不到的數(shù)字:微信朋友圈每天會(huì)上傳10億張圖片,支付寶日交易額峰值超過200億元人民幣,京東每天上傳幾百萬張新的商品信息圖……
這些數(shù)字對(duì)于急需數(shù)據(jù)訓(xùn)練的人工智能算法來說是莫大的好消息。也意味著數(shù)據(jù)對(duì)于人工智能的重要性正在隨著計(jì)算能力、算法的發(fā)展而呈直線上升。但是怎么在浩如煙海的數(shù)據(jù)中篩選出對(duì)我們真正有用的那些?又如何通過分析這些數(shù)據(jù)做出對(duì)自身有利的決策?這就是數(shù)據(jù)科學(xué)家們做的事了。
本期硬創(chuàng)公開課,我們邀請(qǐng)到了iPIN的首席科學(xué)家潘嶸,他于2004年底獲得中山大學(xué)理學(xué)博士學(xué)位后,分別于2005年2月~2007年8月在香港科技大學(xué),以及2007年8月~2009年9月在美國(guó)惠普實(shí)驗(yàn)室,進(jìn)行數(shù)據(jù)挖掘、人工智能等方面的研究。2009年10月通過百人計(jì)劃進(jìn)入中山大學(xué),任職于計(jì)算機(jī)系。2014年起任iPIN首席科學(xué)家。
學(xué)生小十六:數(shù)據(jù)挖掘目前不是一個(gè)定義清晰的學(xué)科,如果選了這個(gè)方向,應(yīng)該必修什么課程?選修什么課程?
潘嶸:必修:(前置課程有程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)與算法、組成原理、計(jì)算機(jī)網(wǎng)絡(luò)等)數(shù)據(jù)庫(kù)、概率與統(tǒng)計(jì)、機(jī)器學(xué)習(xí)與模式識(shí)別。
選修:GPU/并行計(jì)算、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)可視化、深度學(xué)習(xí)、商業(yè)智能(BI)、群體智能(CI),一些面向不同應(yīng)用領(lǐng)域的課程,例如:信息檢索、NLP、語音、圖像方面。
學(xué)生jason:潘老師,我是會(huì)計(jì)在讀博士,到研究方向有點(diǎn)偏金融和機(jī)器學(xué)習(xí)的應(yīng)用。不知道老師您覺得未來的應(yīng)用場(chǎng)景有哪些嗎?
潘嶸:推薦系統(tǒng)是一個(gè)應(yīng)用性極強(qiáng)的問題,我建議你最好先有足夠多的數(shù)據(jù)再開始,最好是有合作的企業(yè),這應(yīng)該是一個(gè)未來很有前景的方向。
學(xué)生小十六:想請(qǐng)問潘老師,如果想學(xué)習(xí)做一個(gè)簡(jiǎn)單但是結(jié)構(gòu)完整的推薦(功能)系統(tǒng),應(yīng)該如何一步步進(jìn)行?主要需要考慮哪些變量因素,采集哪些數(shù)據(jù),運(yùn)用什么算法手段,如何建模和可視化?
潘嶸:不同的推薦問題,數(shù)據(jù)、建模可能都很不一樣。
學(xué)生椰咯斯大O.O:老師,如果個(gè)人愛好者想學(xué)數(shù)據(jù)挖掘,個(gè)人PC機(jī)的性能夠用嗎?如何解決訓(xùn)練數(shù)據(jù)來源的問題呢?
潘嶸:對(duì)于入門來說,個(gè)人PC基本是夠的,除非你要研究深度學(xué)習(xí)。
學(xué)生YM:你們有沒有遇到模型在source domain表現(xiàn)很好,在跟source domain相似的target domain表現(xiàn)不好的情況?有沒有什么unsupervised或者semi-supervised的方式針對(duì)target domain進(jìn)行模型調(diào)整的方法推薦?
潘嶸:這是經(jīng)常會(huì)發(fā)生的情況,可以參考楊強(qiáng)老師在遷移學(xué)習(xí)方面的工作。
學(xué)生Adam.K:潘老師,請(qǐng)問你對(duì)最近很火的對(duì)抗式生成網(wǎng)絡(luò)怎么看,這在NLP領(lǐng)域有什么啟發(fā)嗎?
潘嶸:我是蠻感興趣的,GAN說得挺神奇的,我們目前還有把他應(yīng)用在NLP領(lǐng)域,但是也非常期待我覺得GAN還是有些東西沒有突破,應(yīng)該是有機(jī)會(huì)的。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。