2
本文作者: 張馳 | 2014-11-03 11:14 |
深圳昨晚降溫,寒流來襲,同時(shí)帶來的可能還有流感。百度和Google都有疾病預(yù)測工具,可以幫助及時(shí)了解流感傳播趨勢,做好防護(hù)措施。預(yù)測結(jié)果一般是根據(jù)相關(guān)地區(qū)用戶的搜索量,結(jié)合氣溫變化、環(huán)境指數(shù)、人口流動(dòng)等數(shù)據(jù)做出。
Google流感趨勢在2008年推出后便受到熱烈追捧,它也是大數(shù)據(jù)技術(shù)可用于公眾福利的最好例證。在當(dāng)時(shí),Google的預(yù)測效果還不錯(cuò),其結(jié)果與疾病控制中心(CDC)的數(shù)據(jù)基本相符。但在近兩年,Google的預(yù)測卻與實(shí)際數(shù)據(jù)有很大出入。據(jù)華爾街報(bào)道,Google預(yù)測的流感病例數(shù)較實(shí)際情況高出了75%到95%,有些年份的情況確實(shí)很糟,但遠(yuǎn)沒有Google顯示的那么夸張。
在上周五,Google承認(rèn)了這一情況,并作出了解釋:
流感來臨時(shí),媒體會(huì)大肆報(bào)道,然后網(wǎng)民會(huì)到Google上搜索相關(guān)信息,這會(huì)導(dǎo)致Google預(yù)測到流感大爆發(fā),而這一預(yù)測結(jié)果又會(huì)被媒體進(jìn)一步夸張,引來更多搜索,從而形成惡性循環(huán)。
看來都是媒體的錯(cuò),不過除了它們,Google自己也有不足之處,它僅在最開始時(shí)將預(yù)測結(jié)果與CDC的數(shù)據(jù)進(jìn)行過比較,后來CDC持續(xù)更新數(shù)據(jù),但Google沒有對(duì)準(zhǔn)確性進(jìn)行復(fù)查。隨后Google表示已經(jīng)進(jìn)行了更新,以后的每一季都會(huì)使用實(shí)際統(tǒng)計(jì)數(shù)據(jù)。
雖然搜索引擎的預(yù)測還需要進(jìn)一步優(yōu)化,但是用大數(shù)據(jù)預(yù)測疫情已經(jīng)成為一種趨勢。最近一段時(shí)間埃博拉病毒肆虐,在非洲的研究人員還利用移動(dòng)運(yùn)營商的數(shù)據(jù),為分析區(qū)域人口流動(dòng),幫助預(yù)測埃博拉病毒的傳播。
麥肯錫預(yù)測,如果能有效利用大數(shù)據(jù)來提高醫(yī)療行業(yè)的效率和質(zhì)量,那么僅在美國每年就能創(chuàng)造3000億美元的價(jià)值。
Google的失利只是一次小挫折,說明要改進(jìn)的地方還有很多。另外,好在深圳昨晚才開始降溫,現(xiàn)在做好防護(hù)措施還來得及。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。