2
本文作者: 黃善清 | 編輯:汪思穎 | 2019-04-02 19:39 | 專題:CCF-GAIR 2019 |
雷鋒網(wǎng) AI 科技評(píng)論按:由中國計(jì)算機(jī)學(xué)會(huì)(CCF)主辦、雷鋒網(wǎng)和港中大(深圳)聯(lián)合承辦的第四屆「全球人工智能與機(jī)器人峰會(huì)」(CCF-GAIR)將于 2019 年 7 月 12 日至 14 日在深圳舉行。自 2016 年創(chuàng)辦以來,CCF -GAIR 已先后邀請(qǐng)到 10 余位中美兩國院士、圖靈獎(jiǎng)得主、數(shù)十位 IEEE/ACM/IAPR Fellow、上百位在各自專業(yè)領(lǐng)域享有盛譽(yù)的學(xué)者以及 AI 領(lǐng)域的知名企業(yè)家、投資者和創(chuàng)新者做了大會(huì)報(bào)告及相關(guān)圓桌分享,是目前為止本土人工智能領(lǐng)域規(guī)格最高、影響力最大的峰會(huì)。
應(yīng) CCF-GAIR 2019 大會(huì)主席、港中大深圳校長徐揚(yáng)生院士的邀請(qǐng),諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主 James Heckman 將會(huì)蒞臨大會(huì)現(xiàn)場(chǎng)做主題報(bào)告。身為微觀計(jì)量經(jīng)濟(jì)學(xué)的開創(chuàng)者,其早期在分析選擇性抽樣的原理和方法上的研究工作,為機(jī)器學(xué)習(xí)打下了堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)。
一起來了解他所取得的成就吧。
James J. Heckman,1944 年 4 月 19 日生于美國伊利諾斯州的芝加哥,曾就讀于科羅拉多學(xué)院數(shù)學(xué)系,1971 年獲普林斯頓大學(xué)經(jīng)濟(jì)系博士學(xué)位。曾在哥倫比亞大學(xué)、耶魯大學(xué)、和芝加哥大學(xué)任教。從 1995 年起,赫克曼就在芝加哥大學(xué)獲任亨利·舒爾茨杰出成就經(jīng)濟(jì)學(xué)教授,為芝加哥大學(xué)的教授。微觀計(jì)量經(jīng)濟(jì)學(xué)的開創(chuàng)者,因?qū)Ψ治鲞x擇性抽樣的原理和方法所做出的發(fā)展和貢獻(xiàn),與 Daniel McFadden 一起榮獲 2000 年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
敲開諾貝爾獎(jiǎng)大門的 Heckman Correction
早年的計(jì)量經(jīng)濟(jì)學(xué)主要集中于宏觀經(jīng)濟(jì)學(xué),即研究以國民經(jīng)濟(jì)為主體的經(jīng)濟(jì)行為,至于涉及微觀經(jīng)濟(jì)學(xué)層面的,如個(gè)人、住戶與企業(yè)的經(jīng)濟(jì)行為問題,則較少有人研究,一方面是這方面的統(tǒng)計(jì)數(shù)據(jù)不易找到,另一方面則是微觀數(shù)據(jù)的應(yīng)用在當(dāng)時(shí)產(chǎn)生了許多新的統(tǒng)計(jì)問題:
過去的研究只能觀察某些變量的特定個(gè)體或家庭,由于是非隨機(jī)抽樣的樣本,也就不可能具有代表性。退一步講,即便樣本具有代表性,影響個(gè)體行為的一些特征未必能被觀察到,使得解釋個(gè)體之間的某些差異變得異常困難,這是非實(shí)驗(yàn)性數(shù)據(jù)(non-experimental data)本身所固有的限制。
為此,James Heckman 設(shè)計(jì)出了一系列可以有效解決該問題的計(jì)量經(jīng)濟(jì)學(xué)方法,其中一項(xiàng)便是大名鼎鼎的赫克曼矯正法(Heckman Correction,又稱兩階段方法)。
以研究工資和教育程度的關(guān)系為例,具體的演算可分為兩個(gè)步驟:
第一步,研究者根據(jù)經(jīng)濟(jì)學(xué)理論設(shè)計(jì)出一個(gè)計(jì)算個(gè)體工作概率的模型,而該模型的統(tǒng)計(jì)估計(jì)結(jié)果可以用來預(yù)測(cè)每個(gè)個(gè)體的概率;
第二步,研究者將這些被預(yù)測(cè)個(gè)體概率合并為一個(gè)額外的解釋變量,與教育、年齡等變量一起來矯正自選擇問題。
首先,估計(jì)出不同教育水平的人,參加工作的概率各有多大,這可以通過經(jīng)驗(yàn)數(shù)據(jù)模型得到。然后,刪去不工作之人的樣本,將余留的樣本點(diǎn)依其工作概率的不同,垂直往下位移。工作概率愈小,向下位移愈大;工作概率愈大,向下位移愈小。工作概率百分之百的,不作位移。然后,對(duì)位移后的樣本點(diǎn),求出其回歸線(上圖)。
James Heckman 用該方法陸續(xù)處理了許多類似問題,如失業(yè)者再就業(yè)的時(shí)間間隔、職業(yè)培訓(xùn)的估價(jià)等。2000 年,諾貝爾獎(jiǎng)委員會(huì)決定將該年經(jīng)濟(jì)學(xué)獎(jiǎng)授予 James Heckman 與 Daniel McFadden,以獎(jiǎng)勵(lì)他們發(fā)展廣泛應(yīng)用在經(jīng)濟(jì)學(xué)以及其他社會(huì)科學(xué)中對(duì)個(gè)人和住戶的行為進(jìn)行統(tǒng)計(jì)分析的理論和方法,其中 James Heckman 的主要貢獻(xiàn)是「對(duì)分析選擇性抽樣的原理和方法所做出的發(fā)展和貢獻(xiàn)」:
諾獎(jiǎng)委員會(huì)在 advanced information 特別提及 James Heckman 的 sample selection model 為何具有重要的現(xiàn)實(shí)應(yīng)用價(jià)值——
后來,赫克曼矯正法變成微觀數(shù)據(jù)分析的標(biāo)準(zhǔn)工具,并在無意間影響了人工智能機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展。
眾所周知,機(jī)器學(xué)習(xí)的標(biāo)準(zhǔn)方法是從對(duì)象集中取出一些樣本,接著通過機(jī)器學(xué)習(xí)算法學(xué)習(xí)他們,從而產(chǎn)生一個(gè)預(yù)測(cè)機(jī),然后基于統(tǒng)計(jì)學(xué)原理,從類似的目標(biāo)集中采取新的樣本,使預(yù)測(cè)機(jī)做出準(zhǔn)確的預(yù)測(cè)。可一旦樣本源自于目標(biāo)集的子集或不相關(guān)的目標(biāo)集,就會(huì)產(chǎn)生被稱為協(xié)變量位移 (Covariate Shift) 或域匹配依賴 (domain adaptation depending) 的問題,對(duì)此,機(jī)器學(xué)習(xí)領(lǐng)域過去數(shù)十年所做的大量研究工作,大部分都基于 James Heckman 的研究。
改變?nèi)藗儗?duì)于重要公共政策的定義
James Heckman 并非成日埋頭書齋里做學(xué)問的那種學(xué)者,反而致力于探究與不平等、社會(huì)流動(dòng)性、歧視、勞動(dòng)力市場(chǎng)等相關(guān)的重大社會(huì)及經(jīng)濟(jì)問題的起源,同時(shí)設(shè)計(jì)并評(píng)估針對(duì)這些問題的解決策略。他的工作植根于經(jīng)濟(jì)學(xué),卻積極地尋求跨學(xué)科合作,在勞動(dòng)供給、薪資決定、失業(yè)期間、勞動(dòng)市場(chǎng)輔導(dǎo)計(jì)劃的效益評(píng)估、生育多寡、性別歧視等課題上都有豐碩的成果。
上文提到的 Heckman Correction 即起源于 James Heckman 一九七零年代對(duì)勞動(dòng)供給的實(shí)證研究。他指出根據(jù)個(gè)體經(jīng)濟(jì)理論,工作與否是由勞動(dòng)供給者的效用極大化過程來決定,而這個(gè)過程可以如下的方式解釋:
勞動(dòng)供給者根據(jù)自身的需求擬定出一個(gè)「保留工資」(ReservationWages),勞動(dòng)供給者只有在找到薪水大于這個(gè)保留工資的工作后才會(huì)開始工作,也就是說一個(gè)人是否工作完全是根據(jù)保留工資和真正可拿到的薪水的比較來決定的。
這個(gè)機(jī)制不僅描述了勞動(dòng)供給的決策過程,也同時(shí)解釋了勞動(dòng)供給資料為什么會(huì)有樣本選擇問題,于是有了后來的赫克曼修正法。
來到教育領(lǐng)域,他最具有代表性的工作則是佩里學(xué)前項(xiàng)目(Perry Preschool Project)。
參與該項(xiàng)目的父母更多采用積極的育兒方式,而更少采用專制型的育兒方式,通過對(duì)參與者的長期追蹤研究,該項(xiàng)目發(fā)現(xiàn)相比于未參與項(xiàng)目的對(duì)照組兒童,參與該項(xiàng)目的兒童成年后在偏好、信念與技能上的均值都發(fā)生了顯著變化:集體歸屬感更強(qiáng)、對(duì)人生的態(tài)度更加積極樂觀、對(duì)他人更加熱情友善。
對(duì)此,Heckman 教授強(qiáng)調(diào),智力開發(fā)的干預(yù)越早越好,越往后越難。因此,他大力提倡開展對(duì)弱勢(shì)群體孩子的早期項(xiàng)目。豐富家長養(yǎng)育知識(shí)、創(chuàng)設(shè)有利于提高孩子認(rèn)知能力與非認(rèn)知能力的環(huán)境、定期給孩子閱讀以及提供貧困家庭孩子不可能獲得的益智活動(dòng)等都能帶來智商方面的回報(bào)。
James Heckman 這一系列與社會(huì)緊密結(jié)合的研究工作,使之當(dāng)選 2017 年度美國經(jīng)濟(jì)學(xué)會(huì)(American Economic Association)「杰出院士」(Distinguished Fellow)。
學(xué)會(huì)評(píng)價(jià) James Heckman 不僅在許多方法類研究中作出了貢獻(xiàn),而且在勞動(dòng)經(jīng)濟(jì)學(xué)領(lǐng)域?yàn)檎麄€(gè)人類社會(huì)作出了更為重大的貢獻(xiàn):
「他使得我們重新思考了人類在健康與人力資本上的生命周期投資模式,并改變了人們對(duì)于重要公共政策的定義」。
今年,我們榮幸邀請(qǐng)到 James Heckman 蒞臨 CCF-GAIR 2019 大會(huì)現(xiàn)場(chǎng)為我們做大會(huì)報(bào)告,更多的講者信息及議程,歡迎移步 CCF-GAIR 2019 大會(huì)官網(wǎng)進(jìn)行了解。
此外,我們已正式上線盲訂票與回饋票,以震撼的折扣回饋新老用戶:
目前新用戶盲訂票售價(jià) 799,限量 50 張;
購買過往屆兩屆大會(huì)門票的老用戶則可以獲得更多的折扣,售價(jià) 599,限量搶購。
還等什么?抓緊時(shí)間搶購吧。
CCF-GAIR 2019 大會(huì)官網(wǎng)及盲訂票入口:https://gair.leiphone.com/gair/gair2019
雷鋒網(wǎng) AI 科技評(píng)論屆時(shí)將為大家?guī)淼谝皇肿钚聢?bào)道。
參考文獻(xiàn):
《Heckman兩步法的內(nèi)生性問題》.計(jì)量哥.計(jì)量經(jīng)濟(jì)圈
https://www.sohu.com/a/157114436_499061
《James J. Heckman:以技術(shù)創(chuàng)造解決收入差距與社會(huì)流動(dòng)性問題》.當(dāng)代經(jīng)濟(jì)學(xué)基金會(huì)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章