1
本文作者: 郭佳 | 2018-04-02 18:46 | 專題:駛向自動駕駛的未來 |
說起“路怒癥”,你腦海中會浮現(xiàn)出怎樣的形象?
2017年5月30日,微博網(wǎng)友@寫字李華良 發(fā)出的一條視頻引發(fā)了眾多網(wǎng)友的公憤。
視頻顯示,當天上午9點半左右,李華良開車右轉(zhuǎn)時,因看到前方斑馬線上有行人通過(有老人,也有推嬰兒車的人),于是停車禮讓。然而,他后方一輛車牌號為冀A02***的紅色奧迪車駕駛?cè)藚s嫌他阻礙其右轉(zhuǎn)。于是,奧迪男便惱羞成怒地將他強行截停,下車后對他辱罵、毆打,隨后駕車離開。
事后,李華良立即報警,同時微博發(fā)文,并配以行車記錄儀視頻。
該視頻一經(jīng)發(fā)出就得到大量網(wǎng)友和媒體的轉(zhuǎn)發(fā)評論,打人者因此也在微博“一炮而紅”,被冠以#囂張奧迪男#的稱號,網(wǎng)友希望警方迅速把施暴者繩之以法,畢竟,他不僅打人,還很有可能酒駕,危害公共安全。
事情發(fā)生一天后,打人者依然沒被抓獲,個別網(wǎng)民開始對公安機關(guān)的反應(yīng)速度提出了質(zhì)疑。
其實,破案過程遠比我們想象的復(fù)雜,案件的偵破曾一度陷入僵局。
警方在偵查過程中發(fā)現(xiàn),通過車牌號查到的涉案奧迪車的車主實際并非打人者,且暫時失聯(lián)。聯(lián)系不到車主本人,也意味著無法迅速找到打人者。專案組需要依靠線索中斷的車牌號,以及一段模糊的視頻來在石家莊一千多萬人中鎖定目標。
雖然最終“囂張奧迪男”在6月1號被抓捕,不過具體的偵破過程卻鮮有報道,雷鋒網(wǎng)曾在公開的資料中發(fā)現(xiàn)了下面這段話:
僵局之下,一個名為“昆侖鏡”的情報系統(tǒng)開始加入警方的破案過程中,在研判人員的操作下,警方從車牌號出發(fā)、通過找車主以外的研判路徑很快掌握了犯罪嫌疑人的關(guān)鍵情報,鎖定了打人者,為抓捕直接指明了方向。
聽上去有些神秘的“昆侖鏡”情報系統(tǒng)到底有何威力?它到底是如何幫助警察蜀黍破案的?
為我揭秘這個大數(shù)據(jù)系統(tǒng)奧秘的是“明略數(shù)據(jù)”公安事業(yè)部總經(jīng)理黃艷,她所在的公司正是這個系統(tǒng)的重要搭建者之一。
黃艷自畢業(yè)后一直從事與警務(wù)數(shù)據(jù)有關(guān)的工作,她告訴雷鋒網(wǎng),這起表面看似簡單的案件背后,其實需要交管、情報、刑偵和管轄分局等多個相關(guān)部門的通力合作。
在案件偵破過程中,有兩個關(guān)鍵點,一是你是否掌握了足夠的信息,二是你要如何抽絲剝繭把破案的關(guān)鍵點拎出來。在傳統(tǒng)的破案中,前者需要進行長時間扎實的調(diào)查,后者需要你擁有豐富的偵查經(jīng)驗。
大概情況應(yīng)該像《犯罪心理》劇中的情節(jié)相似,面對整墻的紛雜信息,需要找出最核心的關(guān)聯(lián),依此破案。比如在嫌疑人和被害者的眾多信息中,需要找出哪個關(guān)鍵時間點和關(guān)鍵物證才是可以定罪的突破口。
那現(xiàn)實中,“囂張奧迪男”究竟是如何通過情報系統(tǒng)被揪出來的?
由于破案細節(jié)涉密,黃艷并未直接回答,但她舉了一個例子向我解釋情報系統(tǒng)到底是干嘛的。
首先,情報系統(tǒng)需要將各個不同的信息系統(tǒng)進行整合。
原來系統(tǒng)對于一個人的刻畫可能是這樣的,A系統(tǒng)知道我是一個女的,B系統(tǒng)知道我學(xué)歷是碩士,C系統(tǒng)知道我最近經(jīng)常出差住各地的酒店,D系統(tǒng)知道我坐了哪些航班,F(xiàn)系統(tǒng)可能知道我的日常聯(lián)系人是誰……但這些系統(tǒng)在沒有整合之前,對一個人的刻畫都是片面的,只有把他們進行整合,才會有更立體和全面的描述。
情報系統(tǒng)要做的第一件事就是要對各個系統(tǒng)之間的數(shù)據(jù)進行整合,這就如同你想做一桌子好菜,首先得準備好足夠的食材,避免出現(xiàn)“巧婦難為無米之炊”的狀況。
也就是說,要想破案,警察需要掌握的數(shù)據(jù)不僅來自于公安內(nèi)部的系統(tǒng),還需要來自其他委辦局或者政府部門的多個系統(tǒng)的數(shù)據(jù)。
第二,依據(jù)不同的場景,找出破案的關(guān)鍵點。
數(shù)據(jù)紛繁復(fù)雜,不能要求所有警察都具備孫悟空的火眼金睛,所以必須要揀出哪些才是與破案有關(guān)的關(guān)鍵信息。這就好比你要做出可口的飯菜,除了充足的食材,你還要考慮這么多的食材如何搭配、如何烹飪口味才會最好。
“囂張奧迪男”的抓捕,正是利用了情報系統(tǒng)對上面兩方面信息的處理。其實放眼全球,這類系統(tǒng)的搭建,在美國早有先河。
911 之后,在 CIA (美國中央情報局)等部門在調(diào)查各種線索的同時,斯坦福的的幾個教授也以公開的海量信息為基礎(chǔ),利用計算機建立關(guān)于人物關(guān)系的網(wǎng)絡(luò),最后他們鎖定了一堆疑似人物,并迅速將結(jié)果公開發(fā)布出去。
這讓 CIA 等部門大為震驚,因為教授們所得出的結(jié)果與 CIA 花大量精力偵查和審訊的結(jié)果有很多重合之處,當局迅速飛到斯坦福找教授們問話,懷疑他們與恐怖襲擊有關(guān)。
自此,“人腦+電腦“來分析復(fù)雜問題并輔助破案的可能性,開始被媒體關(guān)注。
回到文章開頭的問題,“囂張奧迪男”最后到底是如何在機場被抓獲?雖然黃艷并未透露破案的細節(jié),但據(jù)雷鋒網(wǎng)推測,這個有些神秘的“昆侖鏡”情報系統(tǒng),應(yīng)該是一個具備多部門信息整合的平臺,從車牌號查到車主后,可以順藤摸瓜,查出親屬關(guān)系、最近通話記錄、相關(guān)航班信息等,最終將打人者抓獲。(此處純屬推測)
雖然信息系統(tǒng)的整合是做所有大數(shù)據(jù)系統(tǒng)的必經(jīng)之路,但黃艷告訴雷鋒網(wǎng),整個過程并不順利。一些地方的警務(wù)數(shù)據(jù)系統(tǒng)比較分散,在整合過程中不僅要滿足不同系統(tǒng)之間的不同權(quán)限,還要滿足各個系統(tǒng)不同的保密需求,這些頂尖的數(shù)據(jù)工程師在繁瑣的開發(fā)過程中遭遇了重重困難。
如何整合不同警種的數(shù)據(jù)就是一項充滿挑戰(zhàn)性的工程,比如有人負責(zé)緝毒、有人負責(zé)抓經(jīng)濟犯罪、有人負責(zé)抓刑事犯罪,它們之間的數(shù)據(jù)都不是完全公開的,而且有些數(shù)據(jù)還涉及公民隱私,不能隨便給其他人看,要制定詳細的權(quán)限,這就是切實存在的問題。
在實際的整合過程中,黃艷和同事發(fā)現(xiàn),單個系統(tǒng)的局部優(yōu)化程度越高,最后整合的工作就越復(fù)雜和不可完成,甚至?xí)霈F(xiàn)許多重復(fù)建設(shè)和資源浪費的情況,整個過程要解決的細節(jié)問題非常多。
起初,一些工程師并不適應(yīng)這種有些基礎(chǔ)并繁瑣的工作方式。比如基礎(chǔ)的檢索工具也是情報系統(tǒng)中的一環(huán),但對于一些工程師來說,他們認為一家高科技公司沒必要做這種非?;A(chǔ)的工作,類似定制化的需求,跟他們的開發(fā)身份不符,但從警察的角度來看,這又是實際需求。
最后解決這個問題的方式,其實有些“簡單粗暴”,但非常有效,就是工程師本人去實際體驗具體的辦案過程,解決這個過程中所遇到的問題,從而理解警方的辦案邏輯。
在具體的信息整合過程中,工程師們會同時想到,在查詢可疑人、可疑關(guān)系、可疑標簽的過程中,為什么要這樣查詢?在哪種業(yè)務(wù)場景下會需要用到這個查詢?查完以后接下來的動作是什么?需要跟哪個警種做互動?是否需要派出所協(xié)查?這一系列的問題都應(yīng)該在產(chǎn)品中進行優(yōu)化。
在深入一線的過程中,這些大數(shù)據(jù)工程師終于實現(xiàn)了從工程師思維到民警思維的轉(zhuǎn)變。
對于黃艷和同行而言,一家頗具“警察思維”的大數(shù)據(jù)公司一直是他們的榜樣,名叫“Palantir”,這家美國公司多年來一直服務(wù)于 CIA、FBI 等情報機構(gòu)。最近,在一張硅谷實習(xí)生工資排行榜中,Palantir 超越谷歌、蘋果等一眾大牌公司,名列第一,換句話說,吃警務(wù)情報這碗飯,非常掙錢!
據(jù)雷鋒網(wǎng)了解,伊拉克戰(zhàn)爭后,反恐變成政府最急切的需求之一。盡管CIA、FBI等情報機構(gòu)掌握著成千上萬個數(shù)據(jù)庫,包括財務(wù)數(shù)據(jù)、DNA樣本、語音資料、錄像片段以及世界各地的地圖,但要在這些數(shù)據(jù)之間建立聯(lián)系,卻相當耗費時間。如何從浩如星海的數(shù)據(jù)中快速找出有價值的線索,提前掌握恐怖份子可能發(fā)動襲擊的消息,對情報部門的技術(shù)水平有非常高的要求。?
“Palantir”的創(chuàng)始團隊認為,硅谷比政府承包商的技術(shù)更先進,因為政府不能接觸到最好的工程師。如果由他們建立一個數(shù)據(jù)分析庫,整合相互分離的數(shù)據(jù)庫來進行搜索和分析,以提升數(shù)據(jù)分析效率,或許可以向政府“推銷”這項技術(shù)。?
讓低調(diào)的“Palantir”一炮而紅的,是通過大數(shù)據(jù)分析識別出了華爾街大佬麥道夫的龐氏騙局、協(xié)助美國當局找到了本拉登的藏身地。當年,眾多媒體用“本拉登最終被大數(shù)據(jù)整死”這樣的標題來報道這個爆炸性的新聞。
由于大數(shù)據(jù)分析在很多案件中發(fā)揮了巨大作用,目前無論是國內(nèi)還是國外,對于警務(wù)系統(tǒng)數(shù)據(jù)的整合分析已經(jīng)是一個大趨勢,但黃艷認為,“堆在一起進行數(shù)據(jù)治理就是大數(shù)據(jù)”這種觀點離真正大數(shù)據(jù)還相差很遠。目前來看,要真正實現(xiàn)大數(shù)據(jù)破案,這三點亟待突破。
第一,需要政策的推動來進行數(shù)據(jù)的整合,這還需要時間。
數(shù)據(jù)掌握的越多,對于破案就意味著能掌握到更多的線索,但各個部門數(shù)據(jù)整合與否的決定權(quán),并不在明略手上,作為一個第三方的服務(wù)公司,它沒有權(quán)限要求北京市的交管部門和海南省的交管部門將彼此的數(shù)據(jù)整合,要想推動這件事向前走,就一定要通過頂層設(shè)計。
黃艷告訴我,中國公安系統(tǒng)目前還是分灶吃飯,就是地方財政的建設(shè)模式,它還沒有那么的集中化和中心化,但未來看,大集中肯定是一個趨勢。
在近兩年的項目中,團隊可以明顯感覺到自公安部開始的自上而下的政策推動效果,各個地方的數(shù)據(jù)正在越來越多的進行整理和匯總,如果沒有這些政策的推動,沒有自上而下對于數(shù)據(jù)的重視,就不會出現(xiàn)像明略一樣的公司,更不會出現(xiàn)這兩年飛速的發(fā)展,是整個環(huán)境造就了行業(yè)的發(fā)展。
第二,需要對業(yè)務(wù)進行深入的挖掘和了解。
任何一個行業(yè)要進行大數(shù)據(jù)的落地,只做一個數(shù)據(jù)資源服務(wù)平臺遠遠不夠。這是一個需要跟業(yè)務(wù)人員反復(fù)溝通、共同創(chuàng)造的過程。
在具體的項目中,要做的不僅僅是數(shù)據(jù)的處理和分析,還需要更多地關(guān)注行業(yè)的業(yè)務(wù)發(fā)展模型,專注分析細節(jié)的處理,這些對行業(yè)洞察的能力,需要在積累一定客戶在基礎(chǔ)上才會有長足的進步。
第三,分析工具固然重要,但是人的判斷也是非常重要,要發(fā)揮人機結(jié)合的最大效用。
當有了數(shù)據(jù),做出具體的業(yè)務(wù)模型后,就需要考慮如何把人和機器的最強的優(yōu)勢發(fā)揮出來。
在數(shù)據(jù)處理的過程中,如果每一條數(shù)據(jù)都需要人來進行處理,會因耗費人力而行不通。但與此同時,數(shù)據(jù)處理分析又需要人的辨識能力,如何協(xié)調(diào)人與機器之間的關(guān)系,是需要解決的核心問題。
“不管白貓黑貓,抓住老鼠就是好貓”。這句老話在警務(wù)系統(tǒng)的建設(shè)中,同樣適用,用了再多的高科技,最后到底能不能幫警察抓住壞人,才是最終考驗。
明略數(shù)據(jù)創(chuàng)始人吳明輝的父親是一名警察。從小,吳比別人更能體會老警察的辛苦,一起重大案件需要幾百個警察分析情報,找線索,過程相當痛苦。因此,吳在創(chuàng)辦明略時,萌生了搭建大數(shù)據(jù)網(wǎng)絡(luò)平臺,讓人工智能協(xié)助警察辦案的想法。
他想,借助數(shù)據(jù)與智能,也許父親以及和父親一樣的警察辦案不用那么辛苦。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章