丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給camel
發(fā)送

0

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

本文作者: camel 編輯:郭奕欣 2017-09-18 15:33
導語:電子科大周濤教授在SMP 2017的keynote演講整理。

雷鋒網(wǎng) AI科技評論按:近期在北京舉辦了第六屆社會媒體處理大會(SMP 2017)。在正會第一天,電子科大周濤教授做了一場關(guān)于大數(shù)據(jù)在經(jīng)濟學、教育學、社會學中應用的特邀報告。周濤教授的精彩報告,時常引發(fā)會場的熱烈掌聲。

在報告最后,他給在場的學者們提出自己的建議,他認為在當前大數(shù)據(jù)和人工智能發(fā)展如火如荼的時代,社會學、經(jīng)濟學、教育學等傳統(tǒng)上只能定性分析的學科正在面臨著巨大的變化;而當時代發(fā)生巨變時,青年學者們一定要站在能夠產(chǎn)生重大成果的地方,所以計算機研究人員一定要多多關(guān)注社會學科,在這些領(lǐng)域做出自己的貢獻。

此外,周濤教授在回答現(xiàn)場的關(guān)于網(wǎng)絡時代個人如何保護自己隱私的提問中,認為個人不應當妄想去保護自己的隱私,因為這是不可能的,也完全沒有意義;保護隱私的責任和義務在于企業(yè)和政府,而個人能做的最好方法不過是歸于平凡。所以最后整個報告以一句經(jīng)典結(jié)束:因為平凡,所以安全。

周濤,現(xiàn)為電子科技大學教授,主要從事統(tǒng)計物理與復雜性方面的研究。在Physics Reports、PNAS、Nature Communications等國際SCI期刊發(fā)表200余篇學術(shù)論文,引用17000余次,H指數(shù)為63。2009年獲教育部自然科學一等獎,2011年獲第十二屆中國青年科技獎,2013年獲四川省科技進步一等獎,2014年獲中國計算機學會自然科學二等獎,2014年起歷年入選Elesvier最具國際影響力中國科學家名單(物理天文類)。2015年當選第十二屆中華全國青聯(lián)常務委員,并擔任科學技術(shù)界別工作委員會副主任。2015年當選全國十大科技創(chuàng)新人物。2016年當選四川省首批杰出人才。2017年獲全國創(chuàng)新爭先獎。

下文為雷鋒網(wǎng)根據(jù)現(xiàn)場記錄,在不改變原意的情況下整理而成。

正文

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

首先非常高興能夠在這里和這么多同事交流這個問題,也非常感謝學旗老師和華偉老師的邀請,謝謝專委會的組織。

剛才劉老師已經(jīng)提到了社會計算的發(fā)展,計算和社會經(jīng)濟學等,我們探討的是同樣的問題。我們的方法是,用大數(shù)據(jù)、人工智能或統(tǒng)計分析的辦法通過海量數(shù)據(jù)去解決經(jīng)濟學、社會學、教育學等問題。實際上大數(shù)據(jù)以及人工智能帶來了很大的變化,對科學最大的沖擊,不是來自于計算機學科本身,很大程度上是來自于它對社會學、管理學、心理學等等學科的影響,把這些原來只是半定量或者定性分析的學科變成了一個定量化的學科。

我今天主要是給大家講三個例子來說明這種影響。這三個例子也都是我們近期的工作,一個是經(jīng)濟學的、一個教育學的,最后一個社會學的。

大數(shù)據(jù)與經(jīng)濟學

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

第一個例子就是我們用大數(shù)據(jù)加上人工智能的辦法,去感知一個區(qū)域經(jīng)濟發(fā)展的真實現(xiàn)象,然后嘗試給出這個區(qū)域經(jīng)濟發(fā)展的建議。

以前我們分析經(jīng)濟,用到了很多指標,像PPI、CPI、GDP等等。但是這些指數(shù)本身具有一些誤解,比如說它比較滯后,往往需要半年甚至一年才能知道以前發(fā)生了什么;此外,中間還夾雜有大量虛假的東西,例如層層假報數(shù)據(jù),讓報上去的數(shù)據(jù)比原有的好看等等。

那么我們想要做什么呢?我們想先了解一個區(qū)域,比如一個地級市,它真實發(fā)生的經(jīng)濟情況是什么樣子的?有沒有風險?以及如果說我們看到一個區(qū)域的發(fā)展,我們能不能給出一些建議?

我們處理的方法是,通過海量事實數(shù)據(jù),通過精確的分析,去感知它宏觀的經(jīng)濟社會是怎么發(fā)展,然后來預測可能的風險。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

舉個例子。我們對300個地級市進行經(jīng)濟社會風險的監(jiān)測。我們不再看它的GDP、PPI、CPI這些。我們收集了一些能夠第一時間反應一個城市變化的數(shù)據(jù)。首先,我們從公開的網(wǎng)站上爬到各個城市的航空、鐵路和公路人口流量(只有四十多個城市有公路人口流量,其他的只有航空和鐵路的人口流量),也就是有多少人坐飛機、火車經(jīng)過這些城市。其次是在這些城市注冊的公司招聘的職位數(shù)目、職位類型和薪資水平。再次是所有這些城市的信息化和科技創(chuàng)新水平。最后是用遙感數(shù)據(jù)觀察這些城市正在進行的重大建設項目,看看地面有沒有人和車輛頻繁運動,地表有沒有發(fā)生變化,從而推斷這些項目是否正常進行。

我們能夠在第一時間獲得第一手這些數(shù)據(jù)。利用這些數(shù)據(jù),我們來反向去看這些城市有沒有可能的重大風險。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

我給大家舉一個特別容易理解的例子,就是像鄂爾多斯這樣的城市出現(xiàn)的問題。鄂爾多斯發(fā)生了什么事情呢?我們知道,在2013年,由于稀土和煤炭價格的大幅度下降,使得原本超高速發(fā)展的鄂爾多斯(當時鄂爾多斯一個城市的經(jīng)濟超過包頭、呼和浩特的總和)的經(jīng)濟迅速下滑,很多建設的樓房都成了空樓,成了全世界最大的“鬼城”。

我們怎么去看這樣一個問題呢?我們分析了兩個很簡單的量。第一個是信息化程度,數(shù)據(jù)就是這個城市有多少上網(wǎng)的IP(例如當年新浪微博、貼吧等)。另一個就是這個城市申請了多少市場占有權(quán)(文章、專利等),依此來看它的科技創(chuàng)新能力。

這個圖中就很有意思。首先看A圖,橫坐標是一個城市的用戶量,縱坐標是它的GDP。09年以前,中國一共是295個地級市,我們有293個完整的記錄數(shù)據(jù)。從這張圖上,我們看到GDP和信息化大致是呈正相關(guān)的。通過線性回歸,我們擬合出一條線,斜率大概為0.93。水平地向上和向下移動這條線,超過這兩條回歸線的,就是異常的城市,例如鄂爾多斯、崇左、來賓、中衛(wèi),它們的信息化水平不高,但是經(jīng)濟水平遠高于對應信息化水平的量。這些城市在2013年就從這條線以上掉了下來。這些城市有一個共同的特點,它們都是高度資源依賴型,例如鄂爾多斯,就是稀土資源比較豐富。

我們知道,在經(jīng)濟學里面,往上發(fā)展10%和往下掉10%是完全不一樣的。當你高速發(fā)展時,很多金融機構(gòu)都給你投資、貸款;但當你往下掉時,很多賬都變成了呆賬、壞賬,然后連鎖效應,帶來金融危機。國家相關(guān)機構(gòu)原來給一個城市投資,包括低息貸款時,它主要看一個城市的經(jīng)濟總量和它前五年的發(fā)展情況;但前面也看到了,鄂爾多斯這樣的城市13年之前,經(jīng)濟總量和發(fā)展都很好,但其通過我們的分析就可以發(fā)現(xiàn),事實上它的風險很大,所以給它借貸的時候就需要謹慎一些。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

下面我們再來看一個關(guān)于巴西的例子。我們從網(wǎng)上爬到了8000多萬條數(shù)據(jù),簡單來說就是,關(guān)于什么樣的人會到什么樣的行業(yè)去工作這樣一個數(shù)據(jù)。巴西分了580多個行業(yè)(中國只分82個行業(yè)),圖中每一個顏色都是一個產(chǎn)業(yè)分類,大概有20多個項,這些項細分為500多個行業(yè),600多個工種。我們建一個圖,每個節(jié)點都是一個600多維的vector,代表了勞工在這些工種中的分布。然后我們計算每兩個vector之間的cos值,表示其相關(guān)程度。圖中每個node的大小表示了這個工種上人數(shù)的比重。

我們通過構(gòu)建這樣的圖,來看哪些產(chǎn)業(yè)之間的關(guān)系較為相近。(當然評價兩個產(chǎn)業(yè)相近有很多辦法,cos值只是其中一種)我們知道,如果兩個產(chǎn)業(yè)相近,那么它們很有可能會有共同的經(jīng)濟元素(人、資源、物流、倉儲等),在發(fā)展過程中可能會有協(xié)同作用。這個圖很明顯是一個中心密集型結(jié)構(gòu)。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

在產(chǎn)業(yè)發(fā)展過程中,我們發(fā)現(xiàn)了一些特點,例如巴西,它有兩條learning trace。一條是inter-industry learning illustration,也即當和 A 產(chǎn)業(yè)相近的產(chǎn)業(yè)發(fā)展的都很好時,那么 A 產(chǎn)業(yè)也很有可能發(fā)展得很好,所以這時候如果投資A產(chǎn)業(yè)就很容易成功。

另一個是inter-regional learning illustration。意思就是,如果我周圍的省A產(chǎn)業(yè)發(fā)展的比較好,而我的A產(chǎn)業(yè)發(fā)展一般般,那么周圍省的A產(chǎn)業(yè)就會帶動我的A產(chǎn)業(yè)的發(fā)展。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

這張圖就說明了上面的情況,橫坐標是相近產(chǎn)業(yè)/地區(qū)的活動密度,縱坐標是新產(chǎn)業(yè)/地區(qū)獲得成功發(fā)展的幾率。圖中右邊的子圖是將兩張圖結(jié)合起來看。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

這種情況不僅在巴西,中國也是這樣(中國只有82個產(chǎn)業(yè)分類,數(shù)據(jù)比較慘)。例如上海發(fā)展起來后,它周邊的杭州、蘇州、無錫等也都相繼發(fā)展起來了;深、廣發(fā)展起來后,連東莞的企業(yè)都大漲。(北京例外)。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

這是從92年到16年北京/河北、上海/浙江的產(chǎn)業(yè)分布圖。從圖中我們可以看出幾個城市產(chǎn)業(yè)的變化。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

在鄰近學習方面,中國的數(shù)據(jù)沒有巴西那么好,不過仍然能夠看出這樣的規(guī)律。如果周邊省份發(fā)展的比較好,那么這一個省份也會發(fā)展比較好;隨著距離的減小,它們的工業(yè)相似性也逐漸增大。

上面的這些基于大數(shù)據(jù)和統(tǒng)計學的分析,我們就發(fā)現(xiàn),不同的城市在不同的發(fā)展線條上,投資應當遵循一定的優(yōu)化策略。這是我講的第一個例子,就是怎樣用海量的數(shù)據(jù)去感知區(qū)域發(fā)展的現(xiàn)狀,給區(qū)域經(jīng)濟發(fā)展提供一個可定量化分析的策略。

大數(shù)據(jù)與教育學

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

教育學的例子就是,我們怎么通過行為數(shù)據(jù)來實現(xiàn)預測性管理。我們要做的一個問題就是去發(fā)現(xiàn)一個學生是否有重大問題。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

對學業(yè)有較大影響的因素有很多,例如身體狀況、智商、DNA、人格、行為等。我們主要關(guān)注人格和行為,因為它們是可以干預和調(diào)整的。以前我們對這些問題的研究只能是通過調(diào)查問卷的形式獲得幾十、幾百的樣本?,F(xiàn)在由于技術(shù)進步,我們能夠獲得海量的數(shù)據(jù),例如通過智能手機、mooc或者wifi等。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

我們用的是學生校園卡使用情況的數(shù)據(jù),我們根據(jù)這些數(shù)據(jù)能夠知道學生在學校里打水、吃飯、洗澡(時間)、去圖書館、借書等等的情況。我們用了18960個匿名學生的大概3000萬個記錄數(shù)據(jù)。

我們先看兩個簡單的例子。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

一個就是orderness,看你的生活是否有規(guī)律。我們用真實熵來衡量orderness。A圖是18960名學生洗澡(時間)的數(shù)據(jù)。我們看到orderness排名前5%的學生(深藍色),生活非常規(guī)律,基本上只在晚上9點洗澡;而后5%的學生(淺藍色),則除了0-6點(澡堂不開門)外一天當中任何時候都可能去洗澡。B圖中是吃飯情況,前5%(棕色)基本上都在三個飯點吃飯,而后5%(橘黃色)則基本上一天當中任何時候都可能去食堂刷卡,生活明顯沒有任何規(guī)律。

說明一下,這里我們之所以用真實熵,而不是香農(nóng)熵或者Simpson熵,是因為我們不僅要看分布的集中性,還要看分布是否有順序(例如吃飯,最好是早、中、晚餐都有,而沒有間斷)。真實熵是可以看到序列的規(guī)律性。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

這張圖也是根據(jù)18960名學生數(shù)據(jù)的分析。右邊這張很容易理解,學習的努力程度(用的是進出圖書館的數(shù)據(jù)來計算)和GPA是高度正相關(guān)的。一個有意思的發(fā)現(xiàn)是,生活的規(guī)律性也和GPA成正相關(guān),也就是說生活越規(guī)律,學習成績就越好。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

值得說明的是勤奮程度和生活的orderness是完全不相關(guān)的。所以前面的兩個正相關(guān)的規(guī)律是完全獨立的。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

基于此,我們做了一個非常有意思的事情就是:異常分析。藍色的是成績下降,紅色的是成績上升。我們發(fā)現(xiàn)成績下降與行為的關(guān)聯(lián)是非常強的,而成績上升則不一定。換句話說,逆襲不太容易,即使你做到了勤奮學習,成績也不一定能有顯著地提升。上升的我們管不了,但是我們可以通過你的異常行為來預測下次考試你的成績是否會下滑。例如,你之前每月去30次圖書館,這個月就去了一次,那么肯定有問題。我們有20多個類似的異常分析。當然我們拿到的數(shù)據(jù)是匿名的,但是每個輔導員都知道大約100個學生匿名數(shù)據(jù)和學號的對應。如果出現(xiàn)了重大異常,例如連續(xù)多天沒有刷卡記錄,計算機就會自動給你的輔導員發(fā)一個通知,我們稱之為失聯(lián)預警。

這個事例就說明,將行為數(shù)據(jù)(特別是orderness數(shù)據(jù))和勤奮程度數(shù)據(jù)結(jié)合起來使用,能夠提高對學生學習成績的預測性。

大數(shù)據(jù)與社會學

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

最后一個例子是怎樣用big data做宗教網(wǎng)絡的組織模式的研究。由于時間原因,我就簡單地介紹一下。我們做的一件事就是用新浪微博的數(shù)據(jù)來做宗教網(wǎng)絡的分析,當然這里面涉及到大量的文本分析,就不再具體說了。我們看一下這些宗教是怎么組織的。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

這是中國的宗教網(wǎng)絡關(guān)系,不同的顏色代表了不同的宗教。人數(shù)最多的竟然是基督教,大概占一半左右;佛教占40%左右,其他道教和伊斯蘭教大概占10%左右。我們看到,宗教與宗教之間也是有聯(lián)系的(相互是粉絲),但是在這張宗教網(wǎng)絡中有一個非常獨特的一點就是,網(wǎng)絡是非常highly, highly, highly,strong, strong, strong的內(nèi)關(guān)聯(lián)的。strong到什么程度呢?如果我們算Newman的Mixing Pattern強度,它是0.987。其他幾百種社交網(wǎng)絡的情況,包括民主黨和共和黨的關(guān)系、不同人種之間的關(guān)系,這些分離都比不上宗教。宗教對內(nèi)非常凝聚,對外則很少連接,這些比民主黨/共和黨,比不同人種之間的分離還要嚴重。這是我們第一個比較大的發(fā)現(xiàn),即宗教帶來的隔離和分離,事實上是高于人種、高于膚色、高于政治信仰、高于國家的。

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

第二個發(fā)現(xiàn)是,既然分離的這么厲害,那么跨越宗教的連接又是怎么樣的呢?通過這張圖我們看到,跨越宗教的連接其實很少;而總體而言,佛教雖然沒有基督教人多,但是它在不同的宗教中起到了保持連通性的作用;通過文本分析,我們發(fā)現(xiàn)百分之七八十的保持連通的邊都有做慈善的標簽。這是一個非常重要的信息。

還有一個非常有意思的信息是,假設計算機是不知道連接之間是否是不同宗教,然后通過逐步去掉這些邊來研究它們的重要性。我們發(fā)現(xiàn)如果按照“度”的方式來去掉這些邊(事實上就是去掉宗教內(nèi)部的連接),網(wǎng)絡是沒有相變的;而如果按照“bridgeness”的大小(bridgeness的大小表明了溝通不同區(qū)域之間的能力)逐漸去掉這些邊,那么在不同的時候會出現(xiàn)兩次相變;當按照“betweenness”的大?。ê唵握f,這個指標衡量了一個節(jié)點作為媒介的能力,也就是占據(jù)在其他兩個節(jié)點最短路徑上最重要的節(jié)點,如果它拒絕溝通信息,那這兩個節(jié)點就無法溝通,占據(jù)這樣的位置越多,它的中介性就越大)依次去掉這些邊,那么整個網(wǎng)絡很快就崩潰了。同樣,如果按“cross link”的大小(連接不同區(qū)域的能力)來依次去掉邊,網(wǎng)絡立馬就崩潰。

這說明,保持整個融合性和聯(lián)通性,是靠著這些跨宗教的人來實現(xiàn)。至于具體的因素,還需要通過文本來分析這些跨宗教的連接到底是來源于什么樣的共同興趣或?qū)傩浴?/p>

總結(jié)

以上我講了三個例子來說明大數(shù)據(jù)、人工智能的研究在經(jīng)濟學、教育學、社會學中的應用。給大家一個建議就是:我有一個非常強烈的感覺,社會學、經(jīng)濟學等已經(jīng)在面臨巨變;當這個時代在發(fā)生巨變的時代,一定要站在很容易產(chǎn)生一些巨大成果的地方;所以我強烈建議,大家對社會學、經(jīng)濟學要有抱負。


提問

問:個人如何保護自己的隱私而不被大公司、大政府甚至恐怖組織所利用?

周濤:這個問題很好。我的判斷是,個人是保護不了自己隱私的。所以個人就不要往這個方面試圖發(fā)力。要發(fā)力的是我們國家通過《網(wǎng)絡安全法》以及《刑法》第二、第三條的解釋,確保公司和企業(yè)去保護你的隱私。一種方式就是它不采集你的隱私;第二種是采集完之后立刻銷毀;第三種就是你授權(quán)它采集,它采集完之后只用在很局限的地方,而不會影響你的個人隱私,不會給你帶來傷害。

所以我們應該做的是去通過法律來約束大企業(yè)去保護你的隱私,個人試圖、或者妄圖保護自己的隱私是完全不可能的,也沒有任何價值。例如,只要你出了這個門,在北京市里,天眼都能知道你的軌跡。你還能不上街?你敲擊鍵盤的順序,原則上主機商都能拿到!所以自己保護隱私,這是不太可能的事。所以還不如期望好公司高抬貴手,不侵犯你的隱私。

另外就是,平凡的人會被保護得更好。比如iPhone被攻擊后,很多女明星的裸照就被上傳了,但同時很多其他被攻擊的人照片就沒有被上傳。這是因為她們太平凡,連黑客都不去關(guān)注。

因為平凡,所以安全。

雷鋒網(wǎng)注:SMP 2017已然結(jié)束,第七屆社會媒體處理大會(SMP 2018)將在哈爾濱市召開。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

電子科大周濤教授:當時代發(fā)生巨變,一定要站在能夠產(chǎn)生重大成果的地方 | SMP 2017

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說