丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李帥飛
發(fā)送

0

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

導(dǎo)語(yǔ):大船的體量太大,有一個(gè)慣性,因此它有更大的可能性撞上冰山。

近來(lái),一個(gè)關(guān)于美國(guó)和歐洲疫情數(shù)據(jù)的 "神預(yù)測(cè)" 的日更博客,在網(wǎng)上火了。

到底有多神呢?略舉二三,如下: 

  • 3 月 27 日起的連續(xù) 10 天里,該博客對(duì)美國(guó)感染人數(shù)的預(yù)測(cè)準(zhǔn)確率都在 90% 以上,其中在 4 月 4 日,準(zhǔn)確率接近 100%(預(yù)測(cè)為 276727,實(shí)際為 276931)。

  • 3 月 31 日,該博客預(yù)測(cè)美國(guó)疫情將在 8-10 天內(nèi)當(dāng)檢測(cè)人數(shù)超過(guò) 200 萬(wàn)的時(shí)候出現(xiàn)斷崖式下跌;7 天之后,也就是 4 月 6 日,美國(guó)疫情數(shù)據(jù)出現(xiàn)斷崖式下跌,增幅從 12.43% 降為 8.13%——這篇文章引起了巨大反響,閱讀量超過(guò) 134 萬(wàn)。

  • 自 3 月 27 日以來(lái),該博客對(duì)歐洲感染人數(shù)的每日預(yù)測(cè)平均準(zhǔn)確率達(dá)到 97%,其中在 4 月份的前五天,預(yù)測(cè)準(zhǔn)確率接近 100%。 

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

李志斌對(duì)美國(guó)感染人數(shù)的預(yù)測(cè)(樂(lè)觀),準(zhǔn)確率高達(dá) 90%

對(duì)此,有網(wǎng)友評(píng)論稱:大神,病毒都聽你的,絕了。

要知道,新冠肺炎疫情的爆發(fā)是一個(gè)涉及到政治、經(jīng)濟(jì)、地理等諸多復(fù)雜因素的全球性重大公共事件,對(duì)具體人數(shù)的預(yù)測(cè)聽起來(lái)就像是天方夜譚,準(zhǔn)確率更是一門玄學(xué)——所以,能夠?qū)崿F(xiàn)上述的預(yù)測(cè)成績(jī),這個(gè)博客背后的博主堪稱是當(dāng)代 "神算子" 了。 

那么,這位 "神算子" 是怎么煉成的? 

清華大學(xué)畢業(yè) + 8 年市場(chǎng)預(yù)測(cè)經(jīng)驗(yàn) 

這個(gè)博客背后的博主,也就是 "神算子" 本人,名為李志斌。

李志斌,1980 到 1985 年就讀于清華大學(xué)計(jì)算機(jī)系,1985 到 1994年,他就讀并就職于中科院,三十歲擔(dān)任副研究員、產(chǎn)品部主任、所長(zhǎng)助理,1994 年移居新西蘭,后定居香港至今,現(xiàn)任香港致佳物流軟件有限公司、香港易經(jīng)科技有限公司總經(jīng)理。

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

李志斌博客截圖

在李志斌所在的這兩家公司中,前者的主營(yíng)業(yè)務(wù)是物流系統(tǒng)開發(fā)(Logistics Systems);后者有香港中文大學(xué)背景,主要業(yè)務(wù)是市場(chǎng)需求預(yù)測(cè)(Market Demand Forecast),也就是為企業(yè)提供在未來(lái) 3 到 6 個(gè)月內(nèi)特定區(qū)域的產(chǎn)品需求、價(jià)格波動(dòng)等方面的數(shù)據(jù)分析和預(yù)測(cè)。

在接受雷鋒網(wǎng)專訪時(shí),李志斌表示,他從 2012 年開始進(jìn)入數(shù)據(jù)分析和預(yù)測(cè)領(lǐng)域,由于易經(jīng)公司的香港中文大學(xué)背景,李志斌也從教授們那里耳濡目染學(xué)了不少東西。

另外,從技術(shù)層面來(lái)說(shuō),李志斌在清華大學(xué)計(jì)算機(jī)系的學(xué)習(xí)經(jīng)歷,也讓他在軟件建模、大數(shù)據(jù)分析等方面已經(jīng)形成一個(gè)完備的知識(shí)體系;同時(shí),清華大學(xué)的理工科學(xué)風(fēng)和背景,也讓他更加重?cái)?shù)據(jù)、重證據(jù)、重例舉,而不是重結(jié)論。

所有這些加起來(lái),讓李志斌對(duì) "數(shù)據(jù)" 非常敏感。

去年底今年初,武漢開始報(bào)告病例,香港也出現(xiàn)疑似新冠病毒患者,這讓長(zhǎng)期身在香港的李志斌頗為警惕;到了 2020 年 1 月 7 日,香港特別行政區(qū)政府宣布新冠肺炎為法定傳染病,并開始向公眾通報(bào)疫情數(shù)據(jù),由此,李志斌開始了對(duì)新冠肺炎相關(guān)數(shù)據(jù)的追蹤

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

從那時(shí)開始,李志斌每天早上起來(lái)進(jìn)行集中數(shù)據(jù)采集,一開始只是武漢、湖北、香港的數(shù)據(jù),后來(lái)是內(nèi)地其他地區(qū)數(shù)據(jù),到了 1 月下旬,開始收集海外數(shù)據(jù),并整理成 Excel 表,同時(shí)開始利用自己的專業(yè)知識(shí)進(jìn)行數(shù)據(jù)建模,并結(jié)合新聞中的數(shù)據(jù)對(duì)官方通報(bào)數(shù)據(jù)進(jìn)行分析和判斷。

最初,李志斌只是在清華的同學(xué)群里分享數(shù)據(jù)和觀點(diǎn),后來(lái)也每天花出 30 分鐘的時(shí)間來(lái)博文,并發(fā)表在新浪博客上。如今,這已經(jīng)形成了每天的習(xí)慣。

當(dāng)然,對(duì)于李志斌而言,除了對(duì)常規(guī)的數(shù)據(jù)進(jìn)行收集、整理和分析之外,他也在不斷結(jié)合自己的專業(yè)知識(shí)來(lái)構(gòu)建一個(gè)數(shù)據(jù)模型,并且不斷對(duì)這個(gè)模型進(jìn)行參數(shù)補(bǔ)充和驗(yàn)證,使之達(dá)到預(yù)期中的效果。

到了 3 月 27 日,李志斌在數(shù)據(jù)模型已經(jīng)趨于穩(wěn)定的基礎(chǔ)上,第一次給出了針對(duì)美國(guó)感染情況的預(yù)測(cè)數(shù)據(jù);3 月 28 日,他又給出了針對(duì)歐洲感染情況的預(yù)測(cè)數(shù)據(jù)。

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

李志斌對(duì)歐洲感染人數(shù)的預(yù)測(cè),平均準(zhǔn)確率高達(dá) 97%

在他的預(yù)測(cè)中,不僅僅包含感染病例數(shù)量,還包括感染增速、峰值時(shí)間、總感染人數(shù)、總死亡人數(shù)、死亡率等數(shù)據(jù)——當(dāng)然,感染人數(shù)是他用來(lái)衡量預(yù)測(cè)準(zhǔn)確率的最為重要的指標(biāo)。

就連李志斌自己都沒(méi)有想到,自己的預(yù)測(cè)數(shù)據(jù)會(huì)那么準(zhǔn)。

但是李志斌強(qiáng)調(diào),沒(méi)有人可以 100% 準(zhǔn)確預(yù)測(cè)未來(lái),一定要滾動(dòng)預(yù)測(cè)。他表示: 

預(yù)測(cè)是一個(gè)動(dòng)態(tài)過(guò)程,因?yàn)楹枚嗉磿r(shí)措施、事件等突發(fā)因素,是無(wú)法預(yù)測(cè)的,這個(gè)時(shí)候需要把這些突發(fā)事件和決定等因素變成對(duì)參數(shù)的調(diào)整,反饋到預(yù)測(cè)模型中,使之運(yùn)行更加準(zhǔn)確。我的預(yù)測(cè)模型、預(yù)測(cè)參數(shù)也在不斷完善過(guò)程中。

再好的軟件也不能 100% 預(yù)測(cè)準(zhǔn)確

李志斌的預(yù)測(cè),離不開兩個(gè)核心要素:數(shù)據(jù),和預(yù)測(cè)模型。 

首先是數(shù)據(jù)的可信度問(wèn)題。在采訪中,李志斌表示,自己從 1 月份開始每天收集數(shù)據(jù),一開始只有武漢和香港有數(shù)據(jù),一直到現(xiàn)在,每天收集上百個(gè)國(guó)家和地區(qū)的數(shù)據(jù)。

李志斌強(qiáng)調(diào),在數(shù)據(jù)收集和分析的過(guò)程中,一定需要甄別數(shù)據(jù)沖突(Data Conflicting)的出現(xiàn);尤其是在官方通報(bào)的數(shù)據(jù)量比較大的情況下,會(huì)用好多方法包括新聞數(shù)據(jù)去檢查不同地區(qū)的數(shù)據(jù)之間可能存在的數(shù)據(jù)沖突,數(shù)據(jù)沖突點(diǎn)越多,數(shù)據(jù)的可信度越低。

同時(shí),在判斷數(shù)據(jù)真實(shí)性的過(guò)程中,要看數(shù)據(jù)發(fā)布的速度;數(shù)據(jù)發(fā)布頻率越高,那么可信度就會(huì)更高一些——而南亞、東南亞地區(qū)發(fā)布的數(shù)據(jù)比較少、比較慢,可信度就會(huì)打折扣。

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

來(lái)自美國(guó) CDC 官網(wǎng)的疫情情況

另外,在對(duì)數(shù)據(jù)的可信度進(jìn)行判斷時(shí),還可以借用新聞數(shù)據(jù)來(lái)做對(duì)比。李志斌告訴雷鋒網(wǎng),比如說(shuō),醫(yī)生和病人之間的比例是比較穩(wěn)定的,那就可以用新聞中報(bào)道的醫(yī)療人員數(shù)量,來(lái)反推病人數(shù)量。

他表示,其實(shí),所有的數(shù)據(jù)都可能存在一些人為的誤差或者統(tǒng)計(jì)誤差,沒(méi)有任何地區(qū)的可信度是百分之百;但是相對(duì)來(lái)說(shuō),美國(guó)的數(shù)據(jù)沖突比較少,在可信度上高一些,歐洲的數(shù)據(jù)可信度次于美國(guó),因?yàn)槲鳉W與東歐之間的不平衡,所以會(huì)取平均值。但印度、東南亞、日本等地區(qū)的數(shù)據(jù)就似乎存在一些問(wèn)題,數(shù)據(jù)發(fā)布慢、數(shù)據(jù)沖突點(diǎn)較多,影響了數(shù)據(jù)可信度的設(shè)置。

到二月底,在之前以國(guó)內(nèi)數(shù)據(jù)為基礎(chǔ)建模、驗(yàn)證的基礎(chǔ)上,李志斌開始對(duì)美國(guó)、歐洲兩個(gè)地區(qū)進(jìn)行疫情數(shù)據(jù)預(yù)測(cè)。于是,在數(shù)據(jù)的基礎(chǔ)之上,李志斌打造了一個(gè)預(yù)測(cè)模型——實(shí)際上,這是一個(gè)極為復(fù)雜的模型,加起來(lái)有上百個(gè)參數(shù),其中重要的參數(shù)有二三十個(gè),分為以下三類: 

  • 第一類是疫情參數(shù)——不同地區(qū)/國(guó)家/城市確診人數(shù)、人口、每日新增確診人數(shù)、疑似人數(shù)、每日檢測(cè)人數(shù)、死亡人數(shù)、治愈人數(shù)(含自愈人數(shù))、在診人數(shù)、入院人數(shù)(重癥人數(shù))。

  • 第二類參數(shù)與地區(qū)/城市/國(guó)家特征相關(guān)——城市類型(古城、現(xiàn)代城市、鄉(xiāng)村)、人口密度、氣溫、天氣(大雨、陰雨、有霧、天晴等)、城市 60 歲以上老年人口比例、城市平均年齡、城市建設(shè)情況(主要是下水道的狀況)。

  • 第三類參數(shù)是關(guān)于資源和管治能力——醫(yī)療資源、病床數(shù)量、社會(huì)組織能力、信息透明度、管理方式等等。 

李志斌表示,在實(shí)際的操作過(guò)程中,一般是先用 Excel 收集數(shù)據(jù),然后導(dǎo)入到后臺(tái)數(shù)據(jù)庫(kù)中,在用自己開發(fā)的軟件模型(里面包含了算法)來(lái)得出三個(gè)結(jié)論,最后自己會(huì)再人為地就結(jié)果進(jìn)行判斷——他強(qiáng)調(diào),有很多參數(shù)是不能量化的,比如說(shuō)社會(huì)情緒;所以需要人為參與。

他還表示:再好的軟件也不能百分之百預(yù)測(cè)準(zhǔn)確。

當(dāng)大船和小船同時(shí)遇見冰山

在采訪中,雷鋒網(wǎng)發(fā)現(xiàn),畢業(yè)于清華大學(xué)的李志斌,有著超越數(shù)據(jù)分析之外的超前洞見和思維。

比如說(shuō),在建模過(guò)程中,李志斌是從國(guó)內(nèi)的數(shù)據(jù)開始的,這些數(shù)據(jù)不僅對(duì)李志斌的建模過(guò)程產(chǎn)生了重要影響,也讓他得出了一些觀察。于是,武漢封城前一天,他就在自己所在的 "清華 80 同學(xué)群" 里和同學(xué)們分享了兩個(gè)想法: 

  • 一是武漢應(yīng)當(dāng)立即封城,因?yàn)閿?shù)據(jù)上升太嚇人;

  • 二是在湖北尤其是武漢地區(qū)快速建立二三十個(gè)網(wǎng)格式野戰(zhàn)醫(yī)院,作為隔離救治中心,所謂野戰(zhàn)醫(yī)院,也就是后來(lái)的方艙醫(yī)院,因?yàn)橐咔榘l(fā)展太猛,隔離病人是比治療更為關(guān)鍵的防控措施。 

這些想法在同學(xué)群里引起了很多討論,當(dāng)然也有質(zhì)疑和反對(duì),但更多的是同學(xué)們的積極參與,并提出了好多更好的想法和建議,獲益良多。后來(lái)的事實(shí)證明,這些想法都是中肯的,并且也被官方后續(xù)采取的措施所印證——其中關(guān)于野戰(zhàn)醫(yī)院等想法更是超前了兩周。

除了上述建議,李志斌還在數(shù)據(jù)分析和模型構(gòu)建的過(guò)程中發(fā)現(xiàn),成為疫情爆發(fā)點(diǎn)的城市往往具備幾個(gè)特征:

  • 老城區(qū);

  • 氣候潮濕;

  • 氣溫 5-15 度;

  • 下水系統(tǒng)老化;

  • 老年人比例高。

值得一提的是,在不同國(guó)家的疫情爆發(fā)城市,如中國(guó)武漢、韓國(guó)大邱、意大利米蘭、伊朗德黑蘭、美國(guó)紐約等,都大致符合這些特征。

對(duì)于這些特征的歸因,李志斌強(qiáng)調(diào),其中夾雜了個(gè)人的主觀合理猜測(cè),但也經(jīng)過(guò)一系列的結(jié)果驗(yàn)證,最終才體現(xiàn)在預(yù)測(cè)結(jié)果中。他還表示,實(shí)際上,在參數(shù)中,還涉及到社會(huì)組織方式、管理模式、社會(huì)信息透明度等問(wèn)題,所以他在預(yù)測(cè)中也會(huì)把結(jié)果設(shè)定為悲觀或樂(lè)觀。

雷鋒網(wǎng)注意到,如果按照李志斌在在 4 月 4 日給出的悲觀預(yù)測(cè)結(jié)果,他對(duì)美國(guó)感染人數(shù)的總體預(yù)測(cè)準(zhǔn)確率高達(dá) 96%。

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

李志斌對(duì)美國(guó)感染人數(shù)的預(yù)測(cè)(悲觀),準(zhǔn)確率高達(dá) 96%

不過(guò),在專訪中,盡管有人為參與,但李志斌還是強(qiáng)調(diào)了數(shù)據(jù)在決策中的絕對(duì)地位。他表示,即使是拋開疫情不談,在一個(gè)日常的決策過(guò)程中,數(shù)據(jù)的重要性可以說(shuō)是百分之百的;這些數(shù)據(jù)不僅僅要真實(shí),而且要全面,還要透明,即使在后續(xù)過(guò)程中有人的參與,也是要基于這些數(shù)據(jù)判斷而來(lái)的——數(shù)據(jù),正是決策的基礎(chǔ)。

那么,基于數(shù)據(jù)的決策,有多大的覆蓋面呢?

李志斌認(rèn)為,即使是新冠肺炎疫情這樣的頗具偶然性、又包含政治、經(jīng)濟(jì)等復(fù)雜社會(huì)因素的群體性公共事件,也是可以預(yù)測(cè)的。 

他表示,類似于傳染病的情況,它的發(fā)展存在著一種特定的模式(Pattern),偶然之中有規(guī)律在,我們也許無(wú)法掌握 100% 準(zhǔn)確的規(guī)律,但是在一定的規(guī)律占比下,我們依然可以做出一些判斷和決策——當(dāng)然前提是巨大的有效數(shù)據(jù)量。

由此,李志斌還談到了一個(gè)有趣的比喻:

一只大船和一只小船,在突然遇到冰山時(shí),它們勢(shì)必要拐彎;但相對(duì)來(lái)說(shuō),大船的結(jié)局顯然更具有可預(yù)測(cè)性。小船一下子就改過(guò)來(lái)了,但大船的體量太大,有一個(gè)慣性,因此它有更大的可能性撞上冰山——這個(gè)慣性就是規(guī)律,而船的體量本身,就是數(shù)據(jù)量。

神機(jī)妙算!清華校友預(yù)測(cè)美國(guó)疫情發(fā)展,準(zhǔn)確率達(dá) 96%,網(wǎng)友:病毒都聽你的,絕了

數(shù)據(jù)量越大、數(shù)據(jù)越準(zhǔn)確、相關(guān)信息越透明,這種群體性事件發(fā)生的時(shí)候就越容易預(yù)測(cè)、且預(yù)測(cè)越準(zhǔn)確——李志斌最后如是說(shuō)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

作者

雷鋒網(wǎng)編輯,歡迎來(lái)撩。微信 ID:XI_308.
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)