0
本文作者: 李賡 | 2017-07-17 18:03 | 專(zhuān)題:GAIR 2017 |
10多年的苦讀,幾天的輪番考試,這是高考給人的主要印象。但這實(shí)際上卻是“簡(jiǎn)單的”,因?yàn)楦呖嫉穆窂骄驮谀抢铮闼枰闹皇乔斑M(jìn)。
相比之下,高考志愿反而要“難不少”,你需要根據(jù)往期的分?jǐn)?shù)去估算錄取概率,你需要通過(guò)第三方資料評(píng)估學(xué)校、專(zhuān)業(yè)的實(shí)力,你甚至需要思考規(guī)劃自己未來(lái)30年的人生。這也讓高考志愿實(shí)際成為了整個(gè)高考過(guò)程中的“第二道跨欄”,甚至許多人的人生也隨之改變。
而想要跨好這一道“跨欄”,通常的方法只能依靠著有著類(lèi)似經(jīng)驗(yàn)的哥哥姐姐、老師又或者是專(zhuān)門(mén)的高考志愿專(zhuān)家。但真正能把志愿報(bào)好的人實(shí)在鳳毛麟角。但有一家公司卻打算用人工智能技術(shù)來(lái)提供幫一眾考生填報(bào)高考志愿,用他們CEO的話來(lái)說(shuō)——人工智能填報(bào)高考志愿比95%專(zhuān)家靠譜,你也可以說(shuō)我們可能要嘗試著把人生“交”到AI手里。
這家公司就是iPIN,公司的口號(hào)是“讓決策更智能”。恰逢,iPIN也來(lái)到了上一周CCF-GAIR大會(huì)的現(xiàn)場(chǎng)。CCF-GAIR大會(huì)是中國(guó)計(jì)算機(jī)協(xié)會(huì)(CCF)主辦,雷鋒網(wǎng)和香港中文大學(xué)(深圳)承辦的年度前沿科技大會(huì)。以下是雷鋒網(wǎng)在現(xiàn)場(chǎng)對(duì)iPIN CEO楊洋采訪記錄:
雷鋒網(wǎng):這次高考中iPIN的產(chǎn)品表現(xiàn)怎么樣,你們有做相應(yīng)的統(tǒng)計(jì)么?
楊洋:去年12月21日《中國(guó)教育報(bào)》公布的全國(guó)調(diào)研中,完美志愿已經(jīng)被全國(guó)高中老師們一致評(píng)為綜合品質(zhì)排名第一的高考志愿填報(bào)工具。具體數(shù)字也有,去年完美志愿就服務(wù)了394萬(wàn)用戶填報(bào)高考志愿。
今年的話同樣非?;馃?,每天的獨(dú)立用戶數(shù)都超過(guò)20萬(wàn),通過(guò)技術(shù)輸出服務(wù)的用戶超過(guò)百萬(wàn),預(yù)計(jì)本月26號(hào),直接服務(wù)的日活躍用戶將會(huì)突破百萬(wàn)。要知道全國(guó)每年總共只有900萬(wàn)左右高考考生,突破百萬(wàn)的完美志愿目前已經(jīng)是市場(chǎng)占有率第一的產(chǎn)品。最重要的是,iPIN從零做到目前這個(gè)成績(jī)只用了3年。
雷鋒網(wǎng):究竟用人工智能來(lái)完成高考志愿的填報(bào)有多難?
楊洋:我認(rèn)為它比AlphaGo下棋難多了。因?yàn)榍罢呤且粋€(gè)簡(jiǎn)單規(guī)則下的積累學(xué)習(xí)問(wèn)題,而高考志愿本身還要通過(guò)人工智能技術(shù)先對(duì)規(guī)則進(jìn)行探索、學(xué)習(xí)和量化。它實(shí)際上屬于認(rèn)知智能分析領(lǐng)域。
高考志愿填報(bào)本身也是中國(guó)人生涯發(fā)展中非常重要的一個(gè)環(huán)節(jié),所以我們投入了非常多資源去用機(jī)器理解高考志愿填報(bào)是怎么一回事,看志愿填報(bào)是如何影響人一生的發(fā)展的。
我也可以在這里透露一個(gè)數(shù)字,我們從2013年開(kāi)始著手研究到現(xiàn)在,4年間累計(jì)投入已經(jīng)超過(guò)3000萬(wàn)元,目前還在朝著盈利進(jìn)發(fā)。
要知道目前參與我們“完美志愿”這個(gè)項(xiàng)目的有9個(gè)教授,分別來(lái)自6所世界著名大學(xué),包括中山大學(xué)、香港科技大學(xué)、亞利桑那州立大學(xué)。這個(gè)項(xiàng)目成員中科學(xué)家非常多,也恰恰說(shuō)明這個(gè)項(xiàng)目非常復(fù)雜,因?yàn)楦呖忌谔顖?bào)的時(shí)候?qū)嶋H涉及人一生職業(yè)發(fā)展的全部。
雷鋒網(wǎng):人工智能究竟是怎么完成高考志愿填報(bào)這件事的?
楊洋:高考志愿填報(bào)是一個(gè)極其復(fù)雜的事情。要解決它不是某項(xiàng)人工智能技術(shù)能搞定的。它所需要的信息量是巨大的,它所需要的計(jì)算復(fù)雜度也是非常恐怖的。可以說(shuō)高考志愿填報(bào)所需要的計(jì)算和分析能力,已經(jīng)遠(yuǎn)遠(yuǎn)超出了一個(gè)普通人能夠處理的極限。
我們大致是分四步來(lái)完成整個(gè)志愿的填報(bào):
第一步,你需要為自己做一份符合自己特質(zhì)且充分考慮目前就業(yè)市場(chǎng)現(xiàn)狀的生涯規(guī)劃。你要做到對(duì)自己足夠了解,并且對(duì)社會(huì)上各種職業(yè)的現(xiàn)狀足夠了解。所以我們一邊提供各種專(zhuān)業(yè)的測(cè)評(píng)工具,同時(shí)也利用海量數(shù)據(jù)對(duì)各種職業(yè)加以分析。
第二步,根據(jù)生涯規(guī)劃以及每個(gè)學(xué)校各個(gè)專(zhuān)業(yè)的就業(yè)去向,選擇學(xué)校和專(zhuān)業(yè),否則再好的生涯規(guī)劃也無(wú)法實(shí)現(xiàn)。這一點(diǎn)即便大學(xué)里面的老師也不一定清楚,更不用其他普通的人類(lèi)專(zhuān)家了。iPIN當(dāng)時(shí)就是為了做到這一點(diǎn),才創(chuàng)建了中國(guó)歷史上第一個(gè)高校就業(yè)大數(shù)據(jù)庫(kù),覆蓋2500多所高校10萬(wàn)多個(gè)院系的詳細(xì)就業(yè)情況,甚至可以具體到藍(lán)翔技校挖掘機(jī)專(zhuān)業(yè)的就業(yè)詳情。比如外交學(xué)院就業(yè)非常好,中華女子學(xué)院也招收男生,復(fù)旦的國(guó)際政治專(zhuān)業(yè)畢業(yè)生非常受世界一流投資銀行歡迎等這些事實(shí),都是我們通過(guò)海量數(shù)據(jù)分析出來(lái)的。這是人靠經(jīng)驗(yàn)根本做不到的。
第三步,了解各個(gè)學(xué)校的歷史錄取數(shù)據(jù),和今年的詳細(xì)招生計(jì)劃,以估算你去到每個(gè)學(xué)校和專(zhuān)業(yè)的錄取概率。有專(zhuān)家為了估算準(zhǔn)錄取概率發(fā)明了一些方法,比如說(shuō)“大小年”等等。但這些方法在人工智能算法面前就有些簡(jiǎn)陋了。我們通過(guò)人工智能算法驗(yàn)證發(fā)現(xiàn),“大小年”這個(gè)很多專(zhuān)家用來(lái)武裝自己的方法,根本站不住腳。在世界圍棋冠軍柯潔都下不贏AlphaGo的年代,人類(lèi)專(zhuān)家沒(méi)可能比人工智能更擅長(zhǎng)計(jì)算概率。
第四步,詳細(xì)了解每個(gè)學(xué)校在每個(gè)省的錄取規(guī)則,和填報(bào)規(guī)則,并得到一份最優(yōu)的志愿表。這個(gè)事情超級(jí)復(fù)雜。例如,今年浙江省是新高考實(shí)施后的首次高考志愿填報(bào),在填報(bào)規(guī)則甚至高考總分與往年完全不一致的情況下,每個(gè)考生需要填寫(xiě)80個(gè)志愿。即便是再有經(jīng)驗(yàn)的專(zhuān)家也不知道怎么做才靠譜。這遠(yuǎn)遠(yuǎn)超出了普通人的計(jì)算和分析能力了。
以上四個(gè)環(huán)節(jié),環(huán)環(huán)相扣。任意一個(gè)環(huán)節(jié)出錯(cuò),都會(huì)影響最終結(jié)果。
雷鋒網(wǎng):人類(lèi)是否已經(jīng)徹底告別志愿填報(bào)這個(gè)工作了?
楊洋:專(zhuān)家還是有它的獨(dú)到之處的。跟機(jī)器相比,人的最大優(yōu)勢(shì)就是更善于與人溝通。當(dāng)專(zhuān)家與考生面對(duì)面溝通的時(shí)候,更能有效地去捕捉考生在交流時(shí)流露出的各種信息,比如表情等,而且能夠搜集到的信息不受限制。因此專(zhuān)家在(1)對(duì)考生做自我認(rèn)知和(2)收集信息并做更細(xì)致的個(gè)性化方案上是有優(yōu)勢(shì)的。比如國(guó)內(nèi)最知名的志愿填報(bào)專(zhuān)家晨霧老師,身為事業(yè)成功人士,有著豐富的人生閱歷。而且對(duì)志愿填報(bào)的研究可以說(shuō)已經(jīng)上升到了理論高度,這樣的專(zhuān)家我一直是非常尊重和欽佩的,非常難得。
雷鋒網(wǎng):目前認(rèn)知智能領(lǐng)域在國(guó)內(nèi)發(fā)展怎么樣?您認(rèn)為這一項(xiàng)技術(shù)接下來(lái)將會(huì)怎么發(fā)展?
楊洋:目前國(guó)內(nèi)做人工智能95%的人實(shí)際都在做最外端的“感官”,比如各種圖像識(shí)別,各種語(yǔ)音識(shí)別。這不僅僅是國(guó)內(nèi)只有的情況,實(shí)際上國(guó)際上都是如此,關(guān)鍵在于研究認(rèn)知的人本身就很少。相比之下,神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)之類(lèi)的技術(shù)其實(shí)學(xué)術(shù)界比較早就已經(jīng)開(kāi)始研究了。
當(dāng)然,我們同樣也是因?yàn)椤霸纭辈艜?huì)選擇這一塊領(lǐng)域。一方面同類(lèi)競(jìng)爭(zhēng)小很多,同時(shí)越早進(jìn)入一個(gè)領(lǐng)域,還是會(huì)有一些優(yōu)勢(shì)。當(dāng)然,iPIN目前實(shí)際上已經(jīng)在高考志愿、職業(yè)規(guī)劃這樣的小應(yīng)用場(chǎng)景中已經(jīng)“走通了”,盡可能將技術(shù)落地也是我們一直以來(lái)的想法。
二個(gè)是認(rèn)知智能技術(shù)的推廣,相比其他人工智能技術(shù)還是難不少。與B端相比,C端可能還好做一點(diǎn),因?yàn)镃端用戶只看重自身的使用體驗(yàn),并且并不會(huì)有太多的個(gè)性化定制需求。不過(guò)我們也在積極嘗試,法律、建筑、智慧城市等一批項(xiàng)目已經(jīng)向B端客戶開(kāi)放了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章