0
自然災(zāi)害發(fā)生后,人道主義救援組織需要了解受影響人群的位置,需要哪些資源以及安全信息。這些信息是很難在一定時(shí)間內(nèi)用傳統(tǒng)的數(shù)據(jù)收集方法捕獲的。隨著更多人在Facebook上連接和分享,這些數(shù)據(jù)能夠提供實(shí)時(shí)近距離觀察,以幫助人道主義救援組織協(xié)調(diào)工作,并在災(zāi)害期間填補(bǔ)信息的重大差距。雷鋒網(wǎng)了解到,F(xiàn)acebook團(tuán)隊(duì)近日宣布了一個(gè)Facebook災(zāi)難地圖計(jì)劃,幫助救援組織解決他們?cè)趹?yīng)對(duì)自然災(zāi)害時(shí)經(jīng)常遇到的信息方面的關(guān)鍵差距。
Facebook災(zāi)難地圖提供有關(guān)人口所在地點(diǎn),移動(dòng)方式以及自然災(zāi)害時(shí)候安全檢查位置的信息。 所有數(shù)據(jù)會(huì)取消個(gè)人的身份識(shí)別標(biāo)記,并匯總到360平方米的網(wǎng)格或本地管理邊界(例如人口普查邊界)。[1]
本篇博客描述了災(zāi)難地圖數(shù)據(jù)集,如何計(jì)算觀察,以及為確保保護(hù)隱私而采取的措施。
(視頻:https://www.facebook.com/facebook/videos/10155889045356729/)
當(dāng)人們使用啟用位置服務(wù)的Facebook應(yīng)用程序時(shí),他們的經(jīng)緯信息會(huì)定期被收集。位置信息被廣泛應(yīng)用在很多方面,例如推送與使用者最相關(guān)的功能或內(nèi)容。 例如,它允許在小孩被綁架后的目標(biāo)搜索區(qū)域向人民新聞Feed發(fā)送AMBER警報(bào),或者向受自然災(zāi)害影響的地區(qū)的人員發(fā)送安全檢查通知。
據(jù)雷鋒網(wǎng)了解,在匯總和去除識(shí)別的情況下,相同的地理位置數(shù)據(jù)可以在自然災(zāi)害發(fā)生后向人道主義救援組織提供有價(jià)值的信息。 聚合信息不僅有助于保護(hù)隱私,還可以通過將信號(hào)與噪聲分離,使數(shù)據(jù)更易于使用和解釋,從而減少從數(shù)據(jù)轉(zhuǎn)變?yōu)樾袆?dòng)視角所需的中間處理步驟。
災(zāi)難地圖數(shù)據(jù)集通過以下方式跨越時(shí)間和空間進(jìn)行聚合:
時(shí)間聚合:盡管災(zāi)害期間需要及時(shí)的數(shù)據(jù),但是Facebook得合作伙伴的反饋表明,救援組織并不會(huì)實(shí)時(shí)的處理和響應(yīng)新的輸入。 因此,該系統(tǒng)會(huì)定期(例如,每小時(shí),每6小時(shí),每24小時(shí))共享數(shù)據(jù)。[2]
空間聚合:將地理定位點(diǎn)聚合為360平方米的網(wǎng)格或本地管理邊界。
空間平滑:一旦計(jì)算出了每個(gè)度量(例如,在時(shí)間段y內(nèi)的管理或像素單位x中的人數(shù)),則執(zhí)行空間平滑。 對(duì)于每個(gè)空間位置,使用相鄰?fù)咂械闹祦碛?jì)算瓦片本身的值的加權(quán)平均值,更鄰近的瓷磚對(duì)最終結(jié)果有更大的貢獻(xiàn)。 這種局部平均結(jié)果是獲得有更平滑,更清晰信號(hào)的地圖,由于隨機(jī)變化而降低噪聲,同時(shí)保持關(guān)鍵信號(hào)并進(jìn)一步保護(hù)隱私。
使用上述數(shù)據(jù)和聚合技術(shù),可以生成三個(gè)獨(dú)特但互補(bǔ)的數(shù)據(jù)集:
人口:指示每個(gè)網(wǎng)格中Facebook使用群體密度的指標(biāo)。
運(yùn)動(dòng):與網(wǎng)格對(duì)之間的人口移動(dòng)相關(guān)的指標(biāo)。
安全檢查:指示安全檢查簽入密度與每個(gè)網(wǎng)格的總邀請(qǐng)度的指標(biāo)。
通過聚合地理位置數(shù)據(jù),能夠顯示一個(gè)平滑的表示出有多少使用位置服務(wù)的用戶在每個(gè)管理區(qū)域或每個(gè)時(shí)間段的地圖網(wǎng)格中使用Facebook的應(yīng)用程序。
提供計(jì)數(shù)的一個(gè)限制是,哪些值代表與正常重要的偏差并不是很明顯。 為了幫助提供這方面的信息,還需要包括基線計(jì)數(shù) —— 同時(shí)在過去三個(gè)星期內(nèi)平均每個(gè)行政區(qū)域中有多少人(從同一人口測量)的近似值。 通過匹配位置和時(shí)間,研究團(tuán)隊(duì)更加自信,他們所觀察到的任何差異都是由于災(zāi)難事件。 他們還提供額外的統(tǒng)計(jì)數(shù)據(jù),以說明觀察到的密度變化是否具有統(tǒng)計(jì)意義。
數(shù)據(jù)的結(jié)構(gòu)如下,每個(gè)獨(dú)特的區(qū)域計(jì)算每個(gè)度量:[3]
其中,
crisis_name:事件的名稱。
time_window:記錄數(shù)據(jù)的時(shí)間。
area_id:瓦片名稱。 在光柵形式中,這表示地圖上的給定光柵像素,可以在空間上聚合,以便與其他數(shù)據(jù)集可互操作。 在管理表單中,area_id表示可以與其他管理數(shù)據(jù)集(例如普查數(shù)據(jù))連接的區(qū)域的管理邊界名稱。
n_baseline,density_baseline:人們?cè)谕环秶谕粫r(shí)間窗口的平均個(gè)數(shù),但是是前三個(gè)星期平均的數(shù)字。這個(gè)可以估計(jì)出在特定時(shí)間每個(gè)范圍有多少人
n_crisis,density_crisis:在時(shí)間t內(nèi)在瓦片中觀察到的人數(shù)。
n_diff:危機(jī)時(shí)人口與基線人口之間的差異。
percent_change:危機(jī)時(shí)人口與基線人口之間的百分比差異。
z_score:危機(jī)人口與基線差異的標(biāo)準(zhǔn)偏差。
此數(shù)據(jù)集包含有關(guān)在給定時(shí)間段內(nèi)在網(wǎng)格對(duì)之間運(yùn)動(dòng)的人數(shù)的信息。 在基線期間(在災(zāi)難發(fā)生前三周平均的瓦片對(duì)之間的運(yùn)動(dòng))也是這樣測量的,所以可以了解到與災(zāi)難相比,在災(zāi)難期間有多少人或幾個(gè)人正在移動(dòng)。 這有助于將災(zāi)害相關(guān)的運(yùn)動(dòng)與人們的正常遷移模式進(jìn)行區(qū)分。
數(shù)據(jù)集如下所示:
其中,
area_id_start和area_id_end:表示瓦片對(duì),其中s是起始瓦片,e是最終瓦片。
n_people_baseline:在災(zāi)難發(fā)生前三個(gè)星期的時(shí)間段內(nèi)從s向e移動(dòng)的總?cè)藬?shù)。
n_people_crisis:在時(shí)間t期間從s移動(dòng)到e的總?cè)藬?shù)。
n_diff:在災(zāi)難期間從s到e之間相對(duì)于基線的人數(shù)之間的差異。
percent_change:從s到從災(zāi)難發(fā)生到基線的人數(shù)之間的百分比差異。
為每個(gè)災(zāi)難提供的一些指標(biāo)來源于Facebook的安全檢查產(chǎn)品。 安全檢查幫助人們?cè)跒?zāi)難中與朋友和家人聯(lián)系。 受到危機(jī)影響的人們可以安全檢查。 一旦他們簽到,他們還可以邀請(qǐng)可能受影響的其他人。 以這種方式,受邀請(qǐng)人群可以安全地傳播給Facebook上可能受到災(zāi)難影響的人們。
他們匯總并分享安全檢查數(shù)據(jù),以向人們表明他們是安全的。
這些數(shù)據(jù)如下所示:
其中:
n_invited是被邀請(qǐng)到安全檢查的人員總數(shù),位于a區(qū)域。
n_safe是在時(shí)間t或之前某個(gè)時(shí)間內(nèi)a進(jìn)行安全檢查的總?cè)藬?shù)。
safe_ratio是在被邀請(qǐng)的人數(shù)中安全檢查的區(qū)域中的人員的比例。
在分析這些信息時(shí),請(qǐng)務(wù)必記住,受到安全檢查的人員可能不代表受災(zāi)地區(qū)的統(tǒng)一樣本,并且數(shù)據(jù)會(huì)隨著時(shí)間的推移而累積。 另外,為什么人們不能安全檢查有很多原因,例如:他們?cè)谖C(jī)時(shí)是不安全或忙碌的,缺乏連接性,或者完全不受影響,也不覺得需要回應(yīng)邀請(qǐng)。 由于這些原因,重要的是在上下文中考慮這些信息。
災(zāi)害地圖數(shù)據(jù)中包含的觀察代表使用Facebook應(yīng)用程序并啟用位置服務(wù)的人員。 這個(gè)人群可能與更廣泛的人口不同,特別是在信息落后的地區(qū)。
Facebook團(tuán)隊(duì)鼓勵(lì)作為災(zāi)難應(yīng)對(duì)專家的人道主義伙伴將他們的數(shù)據(jù)用作更廣泛的數(shù)據(jù)集的一部分,以幫助資源部署。 具體來說,他們應(yīng)該考慮到這些數(shù)據(jù)代表一些具體的人口,并在他們收到的其他信息的背景下考慮。 作為下一步,他們正在與聯(lián)合國兒童基金會(huì),世界糧食計(jì)劃署和紅十字會(huì)的數(shù)據(jù)科學(xué)小組合作,分析數(shù)據(jù)中的潛在偏差,以便能夠糾正和報(bào)告給社區(qū)。
例如,可以通過將災(zāi)難地圖密度數(shù)據(jù)集與開源人口密度數(shù)據(jù)集(如Facebook的人口密度圖)進(jìn)行比較來評(píng)估數(shù)據(jù)的空間覆蓋。 通過進(jìn)行這種比較,可以清楚地向合作伙伴傳達(dá)任何可能沒有被災(zāi)害地圖人口數(shù)據(jù)集覆蓋的領(lǐng)域。
在接下來的幾個(gè)月中,F(xiàn)acebook團(tuán)隊(duì)將與合作伙伴密切合作,進(jìn)一步驗(yàn)證災(zāi)難地圖數(shù)據(jù)。 在驗(yàn)證數(shù)據(jù)時(shí),他們將采取并行工作,以確保在自然災(zāi)害中積極推動(dòng)政策和響應(yīng)工作的人道主義應(yīng)急人員可以訪問數(shù)據(jù)集。
目前正在開發(fā)的災(zāi)難地圖API和可視化工具的屏幕截圖,顯示的內(nèi)容是2017年3月秘魯皮烏拉的洪水。
Facebook的基礎(chǔ)設(shè)施團(tuán)隊(duì)正在建立一個(gè)API和可視化工具,能夠向世界各地有能力使用數(shù)據(jù)進(jìn)行人道主義反應(yīng)的救援組織提供災(zāi)難地圖。 該API將提供可視化和下載功能,并將與災(zāi)難地圖數(shù)據(jù)集進(jìn)行互操作,從而允許合作伙伴在對(duì)其最有用的聚合級(jí)別(例如網(wǎng)格或管理數(shù)據(jù))中以時(shí)間和空間高分辨率的訪問數(shù)據(jù)。
[1]在某些情況下,危機(jī)影響了整個(gè)國家等大地區(qū),瓦片尺寸略低于分辨率。
[2]如果在時(shí)間窗口中收到一個(gè)人的多個(gè)位置,使用最常發(fā)生的地方; 如果數(shù)量剛好齊平,則在時(shí)間窗口內(nèi)使用最近發(fā)生的最近的地點(diǎn)。
[3]圖表中的公式便于增加理解。
雷鋒網(wǎng)編譯
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。