0
自然災(zāi)害發(fā)生后,人道主義救援組織需要了解受影響人群的位置,需要哪些資源以及安全信息。這些信息是很難在一定時間內(nèi)用傳統(tǒng)的數(shù)據(jù)收集方法捕獲的。隨著更多人在Facebook上連接和分享,這些數(shù)據(jù)能夠提供實時近距離觀察,以幫助人道主義救援組織協(xié)調(diào)工作,并在災(zāi)害期間填補信息的重大差距。雷鋒網(wǎng)了解到,F(xiàn)acebook團隊近日宣布了一個Facebook災(zāi)難地圖計劃,幫助救援組織解決他們在應(yīng)對自然災(zāi)害時經(jīng)常遇到的信息方面的關(guān)鍵差距。
Facebook災(zāi)難地圖提供有關(guān)人口所在地點,移動方式以及自然災(zāi)害時候安全檢查位置的信息。 所有數(shù)據(jù)會取消個人的身份識別標(biāo)記,并匯總到360平方米的網(wǎng)格或本地管理邊界(例如人口普查邊界)。[1]
本篇博客描述了災(zāi)難地圖數(shù)據(jù)集,如何計算觀察,以及為確保保護隱私而采取的措施。
(視頻:https://www.facebook.com/facebook/videos/10155889045356729/)
當(dāng)人們使用啟用位置服務(wù)的Facebook應(yīng)用程序時,他們的經(jīng)緯信息會定期被收集。位置信息被廣泛應(yīng)用在很多方面,例如推送與使用者最相關(guān)的功能或內(nèi)容。 例如,它允許在小孩被綁架后的目標(biāo)搜索區(qū)域向人民新聞Feed發(fā)送AMBER警報,或者向受自然災(zāi)害影響的地區(qū)的人員發(fā)送安全檢查通知。
據(jù)雷鋒網(wǎng)了解,在匯總和去除識別的情況下,相同的地理位置數(shù)據(jù)可以在自然災(zāi)害發(fā)生后向人道主義救援組織提供有價值的信息。 聚合信息不僅有助于保護隱私,還可以通過將信號與噪聲分離,使數(shù)據(jù)更易于使用和解釋,從而減少從數(shù)據(jù)轉(zhuǎn)變?yōu)樾袆右暯撬璧闹虚g處理步驟。
災(zāi)難地圖數(shù)據(jù)集通過以下方式跨越時間和空間進行聚合:
時間聚合:盡管災(zāi)害期間需要及時的數(shù)據(jù),但是Facebook得合作伙伴的反饋表明,救援組織并不會實時的處理和響應(yīng)新的輸入。 因此,該系統(tǒng)會定期(例如,每小時,每6小時,每24小時)共享數(shù)據(jù)。[2]
空間聚合:將地理定位點聚合為360平方米的網(wǎng)格或本地管理邊界。
空間平滑:一旦計算出了每個度量(例如,在時間段y內(nèi)的管理或像素單位x中的人數(shù)),則執(zhí)行空間平滑。 對于每個空間位置,使用相鄰?fù)咂械闹祦碛嬎阃咂旧淼闹档募訖?quán)平均值,更鄰近的瓷磚對最終結(jié)果有更大的貢獻。 這種局部平均結(jié)果是獲得有更平滑,更清晰信號的地圖,由于隨機變化而降低噪聲,同時保持關(guān)鍵信號并進一步保護隱私。
使用上述數(shù)據(jù)和聚合技術(shù),可以生成三個獨特但互補的數(shù)據(jù)集:
人口:指示每個網(wǎng)格中Facebook使用群體密度的指標(biāo)。
運動:與網(wǎng)格對之間的人口移動相關(guān)的指標(biāo)。
安全檢查:指示安全檢查簽入密度與每個網(wǎng)格的總邀請度的指標(biāo)。
通過聚合地理位置數(shù)據(jù),能夠顯示一個平滑的表示出有多少使用位置服務(wù)的用戶在每個管理區(qū)域或每個時間段的地圖網(wǎng)格中使用Facebook的應(yīng)用程序。
提供計數(shù)的一個限制是,哪些值代表與正常重要的偏差并不是很明顯。 為了幫助提供這方面的信息,還需要包括基線計數(shù) —— 同時在過去三個星期內(nèi)平均每個行政區(qū)域中有多少人(從同一人口測量)的近似值。 通過匹配位置和時間,研究團隊更加自信,他們所觀察到的任何差異都是由于災(zāi)難事件。 他們還提供額外的統(tǒng)計數(shù)據(jù),以說明觀察到的密度變化是否具有統(tǒng)計意義。
數(shù)據(jù)的結(jié)構(gòu)如下,每個獨特的區(qū)域計算每個度量:[3]
其中,
crisis_name:事件的名稱。
time_window:記錄數(shù)據(jù)的時間。
area_id:瓦片名稱。 在光柵形式中,這表示地圖上的給定光柵像素,可以在空間上聚合,以便與其他數(shù)據(jù)集可互操作。 在管理表單中,area_id表示可以與其他管理數(shù)據(jù)集(例如普查數(shù)據(jù))連接的區(qū)域的管理邊界名稱。
n_baseline,density_baseline:人們在同一范圍在同一時間窗口的平均個數(shù),但是是前三個星期平均的數(shù)字。這個可以估計出在特定時間每個范圍有多少人
n_crisis,density_crisis:在時間t內(nèi)在瓦片中觀察到的人數(shù)。
n_diff:危機時人口與基線人口之間的差異。
percent_change:危機時人口與基線人口之間的百分比差異。
z_score:危機人口與基線差異的標(biāo)準(zhǔn)偏差。
此數(shù)據(jù)集包含有關(guān)在給定時間段內(nèi)在網(wǎng)格對之間運動的人數(shù)的信息。 在基線期間(在災(zāi)難發(fā)生前三周平均的瓦片對之間的運動)也是這樣測量的,所以可以了解到與災(zāi)難相比,在災(zāi)難期間有多少人或幾個人正在移動。 這有助于將災(zāi)害相關(guān)的運動與人們的正常遷移模式進行區(qū)分。
數(shù)據(jù)集如下所示:
其中,
area_id_start和area_id_end:表示瓦片對,其中s是起始瓦片,e是最終瓦片。
n_people_baseline:在災(zāi)難發(fā)生前三個星期的時間段內(nèi)從s向e移動的總?cè)藬?shù)。
n_people_crisis:在時間t期間從s移動到e的總?cè)藬?shù)。
n_diff:在災(zāi)難期間從s到e之間相對于基線的人數(shù)之間的差異。
percent_change:從s到從災(zāi)難發(fā)生到基線的人數(shù)之間的百分比差異。
為每個災(zāi)難提供的一些指標(biāo)來源于Facebook的安全檢查產(chǎn)品。 安全檢查幫助人們在災(zāi)難中與朋友和家人聯(lián)系。 受到危機影響的人們可以安全檢查。 一旦他們簽到,他們還可以邀請可能受影響的其他人。 以這種方式,受邀請人群可以安全地傳播給Facebook上可能受到災(zāi)難影響的人們。
他們匯總并分享安全檢查數(shù)據(jù),以向人們表明他們是安全的。
這些數(shù)據(jù)如下所示:
其中:
n_invited是被邀請到安全檢查的人員總數(shù),位于a區(qū)域。
n_safe是在時間t或之前某個時間內(nèi)a進行安全檢查的總?cè)藬?shù)。
safe_ratio是在被邀請的人數(shù)中安全檢查的區(qū)域中的人員的比例。
在分析這些信息時,請務(wù)必記住,受到安全檢查的人員可能不代表受災(zāi)地區(qū)的統(tǒng)一樣本,并且數(shù)據(jù)會隨著時間的推移而累積。 另外,為什么人們不能安全檢查有很多原因,例如:他們在危機時是不安全或忙碌的,缺乏連接性,或者完全不受影響,也不覺得需要回應(yīng)邀請。 由于這些原因,重要的是在上下文中考慮這些信息。
災(zāi)害地圖數(shù)據(jù)中包含的觀察代表使用Facebook應(yīng)用程序并啟用位置服務(wù)的人員。 這個人群可能與更廣泛的人口不同,特別是在信息落后的地區(qū)。
Facebook團隊鼓勵作為災(zāi)難應(yīng)對專家的人道主義伙伴將他們的數(shù)據(jù)用作更廣泛的數(shù)據(jù)集的一部分,以幫助資源部署。 具體來說,他們應(yīng)該考慮到這些數(shù)據(jù)代表一些具體的人口,并在他們收到的其他信息的背景下考慮。 作為下一步,他們正在與聯(lián)合國兒童基金會,世界糧食計劃署和紅十字會的數(shù)據(jù)科學(xué)小組合作,分析數(shù)據(jù)中的潛在偏差,以便能夠糾正和報告給社區(qū)。
例如,可以通過將災(zāi)難地圖密度數(shù)據(jù)集與開源人口密度數(shù)據(jù)集(如Facebook的人口密度圖)進行比較來評估數(shù)據(jù)的空間覆蓋。 通過進行這種比較,可以清楚地向合作伙伴傳達任何可能沒有被災(zāi)害地圖人口數(shù)據(jù)集覆蓋的領(lǐng)域。
在接下來的幾個月中,F(xiàn)acebook團隊將與合作伙伴密切合作,進一步驗證災(zāi)難地圖數(shù)據(jù)。 在驗證數(shù)據(jù)時,他們將采取并行工作,以確保在自然災(zāi)害中積極推動政策和響應(yīng)工作的人道主義應(yīng)急人員可以訪問數(shù)據(jù)集。
目前正在開發(fā)的災(zāi)難地圖API和可視化工具的屏幕截圖,顯示的內(nèi)容是2017年3月秘魯皮烏拉的洪水。
Facebook的基礎(chǔ)設(shè)施團隊正在建立一個API和可視化工具,能夠向世界各地有能力使用數(shù)據(jù)進行人道主義反應(yīng)的救援組織提供災(zāi)難地圖。 該API將提供可視化和下載功能,并將與災(zāi)難地圖數(shù)據(jù)集進行互操作,從而允許合作伙伴在對其最有用的聚合級別(例如網(wǎng)格或管理數(shù)據(jù))中以時間和空間高分辨率的訪問數(shù)據(jù)。
[1]在某些情況下,危機影響了整個國家等大地區(qū),瓦片尺寸略低于分辨率。
[2]如果在時間窗口中收到一個人的多個位置,使用最常發(fā)生的地方; 如果數(shù)量剛好齊平,則在時間窗口內(nèi)使用最近發(fā)生的最近的地點。
[3]圖表中的公式便于增加理解。
雷鋒網(wǎng)編譯
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。