丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
健康險 正文
發(fā)私信給劉海濤
發(fā)送

0

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

本文作者: 劉海濤 2020-09-08 15:54
導(dǎo)語:思考健康險智能化轉(zhuǎn)型之前,首先要思考的是,保險流程中的數(shù)據(jù)價值是否被真正應(yīng)用起來。

雷鋒網(wǎng)消息,近日,雷鋒網(wǎng)「醫(yī)健AI掘金志」邀請眾安保險智能中心負責(zé)人孫谷飛,以“數(shù)據(jù)中臺賦能未來保險生態(tài)”為題,對險企內(nèi)部數(shù)據(jù)管理、流通、價值挖掘技術(shù)邏輯進行了解析。

過去,由于技術(shù)手段和數(shù)據(jù)安全的限制,保險公司的各個系統(tǒng)間無法完成高效的數(shù)據(jù)交換和溝通,系統(tǒng)間就像一個個孤島。由于擔(dān)心部門內(nèi)部信息共享不當(dāng),即便是大型保險公司,內(nèi)部很多部門仍處于“信息獨立”的運營狀態(tài)中。

孫谷飛曾在世界人工智能大會上呼吁,“保險公司不僅要豐富自身結(jié)構(gòu)化場景數(shù)據(jù),更需要加強保險公司間和其他行業(yè)的數(shù)據(jù)交流。數(shù)據(jù)開放和隱私安全并非悖論,運用聯(lián)邦學(xué)習(xí)技術(shù)的數(shù)據(jù)隔離特性和加密機制,能夠有效解決不同公司間數(shù)據(jù)共享和聯(lián)合建模問題,解決隱私泄露風(fēng)險?!?/p>

目前,為了實現(xiàn)數(shù)據(jù)價值,眾安在內(nèi)部實行了包含數(shù)據(jù)管理體系、數(shù)據(jù)流通體系以及數(shù)據(jù)價值體系的數(shù)據(jù)中臺戰(zhàn)略。

在數(shù)據(jù)管理層面,數(shù)據(jù)中臺可以對每張數(shù)據(jù)表進行自動掃描,并和過去積累的近3000多種規(guī)則進行比較,自動預(yù)警出哪一張表或哪一事業(yè)部的數(shù)據(jù)質(zhì)量問題,自動發(fā)郵件提醒業(yè)務(wù)部門改正。

在數(shù)據(jù)流通層面,針對過去把數(shù)據(jù)安全重心都放在審批中,審批流程非常嚴,拿到審批特征之后,數(shù)據(jù)流通風(fēng)險急劇增高的情況,眾安通過數(shù)據(jù)分發(fā)超市,將數(shù)據(jù)獲取、挖掘、分析等流程完全集中在系統(tǒng)之內(nèi),提高數(shù)據(jù)流通的基礎(chǔ)上,降低流失風(fēng)險。

以下為孫谷飛演講全文內(nèi)容,醫(yī)健AI掘金志做了不改變原意的編輯:

大家晚上好,非常榮幸接受雷鋒網(wǎng)邀請,今晚給大家做一次分享。我來自于眾安保險,目前主要從事眾安保險AI、大數(shù)據(jù)的研究和落地。

數(shù)據(jù)價值體系的現(xiàn)實困境

數(shù)據(jù)中臺這兩年非?;?,我今天跟大家分享下我們對這個概念的理解,以及數(shù)據(jù)中臺在眾安的實際落地經(jīng)驗,在眾安我們是如何保障數(shù)據(jù)管理、加速數(shù)據(jù)流通,促進數(shù)據(jù)價值挖掘。

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

首先跟大家分享一本書《思考,快與慢》,來自2002年諾貝爾經(jīng)濟學(xué)獎獲得者丹尼爾·卡尼曼。

這本書把人的思維模式分為兩種類型:

第一種是意識快速的自主思維模式,普通人幾秒鐘就完成的一些判斷,比如看一張照片,立馬識別照片內(nèi)容;看一張人臉,立馬識別出是誰。

另外一種方式是慢思考,需要數(shù)年知識積累,花一定時間去思考。例如工作流程中決策、用戶增長、用戶營銷等行為。

為什么會舉這本書作為例子?

主要因為近兩年大家都在談大數(shù)據(jù)、AI,而其中比較成功的AI應(yīng)用都屬于快思考范疇,比如人臉識別和語音識別等

為什么正常業(yè)務(wù)中需要花精力思考的智能場景,沒有快思考智能發(fā)展快?有人覺得背后技術(shù)不一樣,所以快思考技術(shù)發(fā)展比慢思考更加成熟,但兩者背后都是常見的機器學(xué)習(xí)算法,產(chǎn)生這種差異的本質(zhì)問題還是數(shù)據(jù)。

例如AlphaGo下圍棋,機器通過慢思考已經(jīng)可以超越人類,原因在于圍棋運動包括棋盤、棋譜等都已經(jīng)進行很好地數(shù)據(jù)化。

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

但現(xiàn)實中,特別是保險業(yè)務(wù),數(shù)據(jù)并沒有被很好地管理起來,背后因為幾大困難:

第一,數(shù)據(jù)資產(chǎn)不清晰。保險業(yè)務(wù),本身數(shù)據(jù)來源非常多樣,比如財險數(shù)據(jù),從健康到車險、從金融到電商,涉及的數(shù)據(jù)隨著保障的內(nèi)容不斷變化。

另外保險的流程也很多,咨詢、承保、理賠、服務(wù)等,各個環(huán)節(jié)都會產(chǎn)生結(jié)構(gòu)不同的數(shù)據(jù)。另外隨著互聯(lián)網(wǎng)化業(yè)務(wù)的發(fā)展,數(shù)據(jù)來源多樣性和復(fù)雜度也在加大,從最早的業(yè)務(wù)數(shù)據(jù),到社交分享數(shù)據(jù),用戶營銷數(shù)據(jù),甚至可穿戴數(shù)據(jù)等,結(jié)構(gòu)化程度非常不一樣,既包括傳統(tǒng)業(yè)務(wù)數(shù)據(jù),也包含圖片、聲音等客服數(shù)據(jù)。

第二,數(shù)據(jù)孤島問題。每家公司壯大之后,都可能出現(xiàn)各部門之間數(shù)據(jù)成煙囪式發(fā)展。數(shù)據(jù)孤島產(chǎn)生之后,就會忽略數(shù)據(jù)流通建設(shè)。

第三,數(shù)據(jù)價值挖掘鏈路較長。例如數(shù)據(jù)采集,業(yè)務(wù)系統(tǒng)采集、生成都離不開數(shù)據(jù)工程師,而數(shù)據(jù)報表又需要依賴BI同事,價值挖掘由算法同事完成,參與角色非常多、價值鏈路非常長。

另外,處理數(shù)據(jù)門檻越來越高,以前數(shù)據(jù)量在小的時候,對于分析的技術(shù)沒有要求,下載下來,用Excel也可以完成?,F(xiàn)在很多公司每天可能要面對幾T、甚至幾百T的新增數(shù)據(jù),如果想對如此大體量的數(shù)據(jù)進行分析,就需要非常強大的數(shù)據(jù)處理能力,相應(yīng)的技術(shù)門檻越來越高,造成數(shù)據(jù)價值困難重重。

眾安的數(shù)據(jù)中臺

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

這是眾安數(shù)據(jù)中臺總體架構(gòu),主要分為兩大塊,應(yīng)用層和平臺工具層:

應(yīng)用層主要包含兩大方向,1.如何利用技術(shù)去幫助業(yè)務(wù)自動化、降低人力依賴,比如智能客服、自動核身等;2.如何利用數(shù)據(jù)去幫助業(yè)務(wù)去實時洞悉業(yè)務(wù)進展、并提供關(guān)鍵決策支持,BI、異常監(jiān)控、用戶畫像等等。

接下來,我會重點講下平臺層的內(nèi)容,通過數(shù)據(jù)管理體系、流通體系、價值體系三個方面,分享眾安內(nèi)部數(shù)據(jù)中臺經(jīng)驗。

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺? 

數(shù)據(jù)管理體系里面,首先重要就是質(zhì)量問題,任何人,不管是業(yè)務(wù)還是技術(shù)人員,拿到數(shù)據(jù)之后思考的第一件事情,肯定是拿到的數(shù)據(jù)準不準,就需要思考數(shù)據(jù)質(zhì)量好與壞,如果數(shù)據(jù)質(zhì)量差,就會導(dǎo)致垃圾數(shù)據(jù)進垃圾產(chǎn)品出,不能給業(yè)務(wù)提供可靠的支持。

眾安在數(shù)據(jù)質(zhì)量方面怎么做的呢?

第一,眾安作為一家金融公司,首先需要滿足監(jiān)管要求,需要把監(jiān)管對保險行業(yè)的數(shù)據(jù)要求整理成規(guī)則。

第二,注意技術(shù)維度規(guī)范,例如數(shù)據(jù)命名是否規(guī)范,是否符合技術(shù)規(guī)范要求。

第三,業(yè)務(wù)需求層面也需要規(guī)范,通過業(yè)務(wù)需求反推現(xiàn)有數(shù)據(jù)是否滿足要求,比如關(guān)鍵字段是否缺失等。

基于以上三個維度,眾安內(nèi)部已經(jīng)積累3000多個規(guī)則,此外這個規(guī)則庫還在不斷的豐富。

但光建立規(guī)則還不夠,像眾安這樣數(shù)據(jù)體量,人工已經(jīng)很難判斷每條數(shù)據(jù)情況,還需一個平臺去幫助我們每天自動去監(jiān)控數(shù)據(jù)的質(zhì)量——數(shù)據(jù)質(zhì)量管理平臺。平臺會對數(shù)據(jù)中每張表自動掃描,判斷是否符合上面規(guī)則庫中的3000多條規(guī)則,并自動統(tǒng)計和預(yù)警哪一張表或哪一事業(yè)部出現(xiàn)了數(shù)據(jù)質(zhì)量問題。

另外,數(shù)據(jù)質(zhì)量問題,不光是數(shù)據(jù)部門的問題,數(shù)據(jù)部門的主要職責(zé)是發(fā)現(xiàn)和警示數(shù)據(jù)問題,但數(shù)據(jù)產(chǎn)生的源頭其實是在業(yè)務(wù)生產(chǎn)系統(tǒng)中,需要有一個強有力的合作組織去推動數(shù)據(jù)的治理。

為此,目前眾安建立了數(shù)據(jù)治理委員會,委員會既包括數(shù)據(jù)部門、也包括業(yè)務(wù)部門,以及公司的的一些職能部門,比如發(fā)展規(guī)劃部、內(nèi)審部等。。

數(shù)據(jù)委員會需要制定一系列公司的規(guī)章制度,去保障數(shù)據(jù)質(zhì)量問題的治理推進;另外也需要牽頭舉辦定期和不定期的會議,去牽頭解決目前難點或者重點數(shù)據(jù)的問題。

數(shù)據(jù)質(zhì)量是一個不斷發(fā)展,需要不斷跟進的問題,具體的解決之道就是,一把尺子(數(shù)據(jù)質(zhì)量規(guī)則庫)、一個平臺(數(shù)據(jù)質(zhì)量管理平臺)、一個組織(數(shù)據(jù)治理委員會)。

數(shù)據(jù)管理體系——數(shù)據(jù)資產(chǎn)盤點(數(shù)據(jù)地圖)眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

數(shù)據(jù)管理體系里,第二大內(nèi)容就是數(shù)據(jù)資產(chǎn)盤點。

眾安數(shù)據(jù)地圖基于眾安數(shù)據(jù)倉庫和從各系統(tǒng)獲取的的異構(gòu)數(shù)據(jù),分析其中執(zhí)行關(guān)系,做了一個數(shù)據(jù)管理平臺,用一張全景圖把每張圖血緣關(guān)系都羅列出來。

眾安通過這樣一個平臺,將管理累計超過5萬多張表,涉及萬億級數(shù)據(jù)量。其中各張表、各個字段之間的血緣關(guān)系通過自動化的方式進行監(jiān)測維護,將原本散落在不同事業(yè)部的所有數(shù)據(jù)都以資產(chǎn)的形式非常低成本地維護起來。

使得每天報表需求、數(shù)據(jù)加工需求,從凌晨開始,在數(shù)小時之內(nèi)就可加工完成,在業(yè)務(wù)上班之前就可以給到一些移動報表或分析報告支持。

數(shù)據(jù)管理體系——數(shù)據(jù)資產(chǎn)盤點(指標字典)

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

數(shù)據(jù)管理體系第二塊是指標字典。

業(yè)務(wù)一般看數(shù)據(jù)主要是關(guān)鍵指標,所以指標定義對整個數(shù)據(jù)管理非常重要。

但是以往大家都是按需出發(fā)管理報表,接到一個業(yè)務(wù)需求,把報表做出來,具體意義并沒有統(tǒng)一管理,只有做的人知道,一旦這個人離職,或者報表更新迭代、既往報表基本作廢。

如果沒有對指標字典進行準確定義,就一定會導(dǎo)致管理層次、業(yè)務(wù)層次,每個人對業(yè)務(wù)出現(xiàn)不同解釋和定義,指標如果不能統(tǒng)一,報表也就沒有任何價值。

目前眾安把業(yè)務(wù)、管理層、BI分析師等所有指標都進行統(tǒng)一管理,搭建平臺對所有指標進行溯源,發(fā)掘哪些表屬于基礎(chǔ)指標、哪些屬于衍生指標、哪些屬于計算指標。

把這些指標在系統(tǒng)里面進行完整記錄,從名稱到定義,再到來源都管理起來。此外指標還可以動態(tài)跟報表聯(lián)動,改變過去報表是報表,指標是指標,兩套系統(tǒng)的情況。

眾安在做完指標字典之后,可以自動把字典關(guān)聯(lián)到BI分析報表上,業(yè)務(wù)看報表過程中可以立馬查看背后指標順序定義方式,把指標系統(tǒng)設(shè)置成外鏈,嵌入到報表系統(tǒng)里。

數(shù)據(jù)管理體系——數(shù)據(jù)資產(chǎn)盤點(數(shù)據(jù)超市)眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

數(shù)據(jù)服務(wù)資產(chǎn),還需要統(tǒng)一地方進行管理。

現(xiàn)在數(shù)據(jù)人員積累了很多數(shù)據(jù)服務(wù)、數(shù)據(jù)接口,各事業(yè)部數(shù)據(jù)團隊之間并不相通,可能造成重復(fù)對接以及接口數(shù)據(jù)的孤島。因此整個體系需要一個平臺或工具,把數(shù)據(jù)服務(wù)化統(tǒng)一管理起來,在眾安,整套系統(tǒng)叫做“數(shù)據(jù)超市”這樣做主要有幾個好處:

第一,確保可以統(tǒng)一查詢,降低成本。例如在安全合規(guī)的情況下,事業(yè)部可以直接利用其他部門已對接的數(shù)據(jù)接口,這就不需要重復(fù)采購、重復(fù)調(diào)用,大大降低外部數(shù)據(jù)接口調(diào)用成本。

第二,平臺可以提供一些已經(jīng)開發(fā)好的數(shù)據(jù)服務(wù),別人不需要重復(fù)性開發(fā),而且可以統(tǒng)一進行服務(wù)擴容、降級、以及多供應(yīng)商接入,通過簡單接口配置就可以將服務(wù)接入到新應(yīng)用場景當(dāng)中。

每家公司都會接入大量的數(shù)據(jù)服務(wù),也會積累很多有價值的數(shù)據(jù)。數(shù)據(jù)超市就是數(shù)據(jù)接口服務(wù)的一站式服務(wù)平臺,通過這個接口平臺對接的數(shù)據(jù)服務(wù),平臺也會自動幫助各事業(yè)部進行自動分賬。從而達到減少接口的重復(fù)性開發(fā),也最大化地把存量數(shù)據(jù)協(xié)同利用起來,達到降本提效的目的。

數(shù)據(jù)流通體系——安全流通

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺? 

流通的最大困難是什么?

假如A事業(yè)部,想利用B事業(yè)部的數(shù)據(jù),第一個問題就是怎么保障數(shù)據(jù)安全,整個過程需要大量申請,其他事業(yè)部也會用安全理由,拒絕這些數(shù)據(jù)使用。

數(shù)據(jù)流通體系最重要的就是安全,眾安數(shù)據(jù)安全體系主要包括兩方面:數(shù)據(jù)安全分級和集成數(shù)據(jù)應(yīng)用。

眾安在數(shù)據(jù)安全方面,主要做了兩件事情:

第一,把已有數(shù)據(jù)表和數(shù)據(jù)資產(chǎn)按照監(jiān)管以及公司的規(guī)范,進行安全分級。目前眾安有幾萬張表,每一張表根據(jù)數(shù)據(jù)敏感程度都進行分級,可以分為內(nèi)部公開或不公開,外部公開不公開等等,根據(jù)數(shù)據(jù)安全等級在權(quán)限管理、數(shù)據(jù)訪問,下載也可以進行相應(yīng)OA流程制定,保證敏感數(shù)據(jù)進行嚴格流程審批,安全等級清晰,最大化縮小審批流程路徑。

第二,加強數(shù)據(jù)安全管理,我們以集成系統(tǒng)應(yīng)用的形式,盡量讓數(shù)據(jù)不要出安全的環(huán)境。使得數(shù)據(jù)在封閉的環(huán)境中,就能完成數(shù)據(jù)的消費。數(shù)據(jù)審批通過之后,并不是把數(shù)據(jù)下載下來開放使用,如果這樣,前面所有安全措施都會形同虛設(shè),眾安以集成系統(tǒng)方式提供數(shù)據(jù)訪問,減少不可控的數(shù)據(jù)分發(fā)。

過去數(shù)據(jù)審批,往往都是前面審批流程非常嚴,拿到審批批準之后,數(shù)據(jù)流通就會變得非常不可控,如果員工主動或者無意操控失誤,就一定會造成數(shù)據(jù)流失,需要保證所有數(shù)據(jù)都在可控環(huán)境之內(nèi)。

這種可控主要分為幾類:

第一,單純數(shù)據(jù)服務(wù),可以通過集成數(shù)據(jù)服務(wù),利用“數(shù)據(jù)超市”進行發(fā)布。例如客服想選擇一部分經(jīng)授權(quán)的用戶群體進行營銷,就可以在名單不出系統(tǒng)的情況下,通過加密等技術(shù),直接由系統(tǒng)數(shù)據(jù)服務(wù)打通營銷系統(tǒng)。

第二,如果僅僅拿一份數(shù)據(jù)做報表,可以在數(shù)據(jù)不出系統(tǒng)的情況下,建立分析建??梢暬h(huán)境,而不需要把數(shù)據(jù)直接導(dǎo)出去。 

另外,我們也支持通過接口的方式,對接各類應(yīng)用系統(tǒng)。比如,如果我們想進行客戶的圈選和投放,可以直接打通數(shù)據(jù)服務(wù)和投放系統(tǒng),數(shù)據(jù)不會脫離管控環(huán)境。所以說,整個數(shù)據(jù)加工和消費是在一個受安全管控的閉環(huán)環(huán)境。

數(shù)據(jù)流通體系——眾相(用戶標簽系統(tǒng))

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺? 

眾安2019年我們就承保了70億張保單,我們?nèi)绾未?lián)這些保單數(shù)據(jù)?這些保單數(shù)據(jù)屬于不同產(chǎn)品和不同的險種。其實無論險企內(nèi)部車險、健康險等各個部門,真正需要流通的就是用戶數(shù)據(jù),現(xiàn)在互聯(lián)網(wǎng)化就是從以往產(chǎn)品為中心,轉(zhuǎn)化成用戶為中心。

保證用戶數(shù)據(jù)的流通,就要建立用戶標簽系統(tǒng),這個用戶標簽系統(tǒng)主要包括幾件事:

第一,從用戶層次把不同事業(yè)部的用戶數(shù)據(jù)打通,從用戶層面把整個公司的操作行為,購買行為打通,沉淀成標簽,目前眾安內(nèi)部已經(jīng)有1000多個標簽。我們支持離線和實時標簽的圈選,并且能立馬得出客戶的洞察分析,從而支撐我們基于用戶的業(yè)務(wù)交叉營銷和聯(lián)合風(fēng)控。

第二,交叉風(fēng)控。這部分眾安也有很好的案例,例如在信用保證保險和健康險之間進行風(fēng)控,當(dāng)金融事業(yè)部出現(xiàn)一些逾期的客戶,又突然來買非常高額的健康險、意外險,這就可能存在欺詐風(fēng)險。通過類似這樣交叉風(fēng)控手段,每年減少的損失可以達到近千萬。

第三,通過用戶標簽打通客戶數(shù)據(jù),眾安將包括在線、電話、APP、短信等全渠道客戶營銷數(shù)據(jù)打通之后,可以做到實時感知,觸達用戶之前,就可以知道有什么樣的訴求。比如在線客服這邊,客戶問你一個問題,客戶又從電話渠道過來的時候,眾安能立刻知道他買了什么保單,之前有什么問題,從而可以整體提升服務(wù)質(zhì)量。

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺? 

這是眾安內(nèi)部眾相用戶關(guān)系系統(tǒng),可以從用戶信息、保險行為、行為偏好、資產(chǎn)狀況等標簽維度對用戶進行刻畫,在營銷或風(fēng)控之前,就可以通過標簽找到相應(yīng)客戶。

數(shù)據(jù)價值體系——價值路徑

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

圖中所示,這是典型的數(shù)據(jù)價值的挖掘路徑,包括從源數(shù)據(jù)、清洗報表、到OLAP分析、BI機器建模,最終人工智能優(yōu)化?;旧戏譃樗膫€步驟點,

首先通過數(shù)據(jù)去了解“發(fā)生了什么”;

第二,通過數(shù)據(jù)的分析和洞察,多維分析,就了解“為什么會發(fā)生”;

第三,借助算法的力量,如何在未來幫助我們?nèi)ヮA(yù)測和做提前預(yù)警,做到了解“什么時候回發(fā)生”;

最后,借助機器學(xué)習(xí)等算法,幫助我們做到優(yōu)化,告訴我們“什么是最佳決策”。

一套流程下來,可以發(fā)現(xiàn)現(xiàn)有業(yè)務(wù)問題;BI分析可以知道問題為什么會發(fā)生;通過預(yù)測建??梢粤私鈫栴}還會不會發(fā)生;通過優(yōu)化算法,可以知道這些問題需要什么動作解決。

數(shù)據(jù)洞察平臺和機器學(xué)習(xí)平臺

一般在市場上,數(shù)據(jù)分析平臺的產(chǎn)品都是按照數(shù)據(jù)處理的流程或者某一數(shù)據(jù)形態(tài)來區(qū)分的,比如ETL工具、流數(shù)據(jù)處理、OLAP引擎、報表系統(tǒng)、機器學(xué)習(xí)系統(tǒng)等,這是一個十分自然的挖掘數(shù)據(jù)價值的步驟,但是直接采用這些組件的一個缺點就是數(shù)據(jù)在銜接流轉(zhuǎn)會變得異常復(fù)雜與難于管理,比如權(quán)限,上下游變動等等。

另一方面,開源社區(qū)雖然推出了許多優(yōu)秀的項目,但是百家爭鳴,連一個OLAP分析引擎可能就有若干個,各有特色,沒有“silver bullet”(銀彈)。

對于眾安來說,我們基于開源優(yōu)秀的組件以及我們在互聯(lián)網(wǎng)保險與金融科技的最佳實踐,自研了一套覆蓋整個數(shù)據(jù)價值挖掘鏈路的分析平臺:集智平臺。

這套平臺的最大優(yōu)勢就是在一個平臺中囊括了數(shù)據(jù)從數(shù)倉到分析產(chǎn)出結(jié)果的所有步驟,數(shù)據(jù)開發(fā)、數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家在一個統(tǒng)一的平臺上對于數(shù)據(jù)進行加工、分析、建模、可視化。具體來說,集智平臺分為2個模塊,數(shù)據(jù)洞察平臺與機器學(xué)習(xí)平臺。

數(shù)據(jù)洞察平臺

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

數(shù)據(jù)洞察平臺主要解決發(fā)生什么、為什么發(fā)生這兩件事情。

傳統(tǒng)數(shù)據(jù)都是看報表,眾安已經(jīng)有這么多報表平臺的情況下,為什么還要做數(shù)據(jù)洞察平臺?

首先是為了解決大數(shù)據(jù)處理速度問題,千萬行數(shù)據(jù)集在業(yè)務(wù)中是很常見的現(xiàn)象,報表響應(yīng)可能需要幾分鐘或幾個小時,對業(yè)務(wù)分析影響非常大,如果可以達到秒級響應(yīng),對整個分析思路都是很好的幫助,也是為什么需要大數(shù)據(jù)處理能力的原因。

此外,現(xiàn)在大數(shù)據(jù)平臺越來越多,隔幾個月就會出現(xiàn)一個新的大數(shù)據(jù)平臺,使用門檻越來越高,他們的使用方,業(yè)務(wù)或BI很難理解大數(shù)據(jù)平臺本身的復(fù)雜性,造成使用屏障,需要有一個平臺把所有復(fù)雜性都封裝起來。

數(shù)據(jù)洞察平臺是眾安數(shù)據(jù)分析的基礎(chǔ)工具。其最主要的功能有3點。

第一,洞察平臺是一個對數(shù)據(jù)分析師透明的數(shù)據(jù)查詢加速引擎,分析師可以自助式地將數(shù)據(jù)導(dǎo)入洞察平臺,對于億級的數(shù)據(jù)進行即席的查詢與多維下鉆,在技術(shù)上我們針對不同的數(shù)據(jù)形態(tài),采用了不同的數(shù)據(jù)加速引擎,做了一個可插拔式的架構(gòu),可以很快地適應(yīng)新的開源工具而不需要改造上游數(shù)據(jù)消費的應(yīng)用。

第二,我們在洞察平臺同時支持了流處理與批處理,并且抽象出了統(tǒng)一的數(shù)據(jù)模型層,對于分析師來說,不論是近1分鐘的數(shù)據(jù)還是平均30天的數(shù)據(jù),都可以在一個模型里進行可視化或者分析。

第三,洞察平臺也是一個可視化的系統(tǒng),可以非常高效地搭建出各種大屏、報表與移動端應(yīng)用,與業(yè)務(wù)系統(tǒng)非常簡單地進行對接與嵌入。

搭建高效可視化系統(tǒng)

數(shù)據(jù)洞察平臺也是一個可視化的系統(tǒng)。

數(shù)據(jù)除了輔助提供決策價值以外,還要讓業(yè)務(wù)看到數(shù)據(jù)。現(xiàn)在業(yè)務(wù)對數(shù)據(jù)的需求變得越來越多,搭建這些可視化、實時、離線報表,需要把大型報表嵌入到系統(tǒng)里面,讓業(yè)務(wù)決策可以立馬獲得數(shù)據(jù)支持。

現(xiàn)在很少有業(yè)務(wù)打開報表系統(tǒng)看數(shù)據(jù),報表都是BI分析師在看,業(yè)務(wù)更加關(guān)心操縱系統(tǒng)怎樣進行業(yè)務(wù)操作,需要把報表嵌入到他的業(yè)務(wù)系統(tǒng)當(dāng)中。

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

這是眾安內(nèi)部主推的可視化系統(tǒng)案例。這個車點通可視化系統(tǒng),主要有四點好處:

第一,增加數(shù)據(jù)可視化程度。不同角色可以通過系統(tǒng)實時看到自己現(xiàn)在保費收入、業(yè)務(wù)指標、每生成一張保單,數(shù)據(jù)就會發(fā)生變化,所有系統(tǒng)都是移動端,可以做到完全脫離以前報表系統(tǒng),打開手機查看。

這樣的實時展示可以讓車險業(yè)務(wù)部使用人數(shù)得到很大擴展,覆蓋率達到97%,每天業(yè)務(wù)看數(shù)據(jù)的次數(shù)也大范圍增加,以前一天看一次,現(xiàn)在次數(shù)可以增加4次以上。

第二,支持業(yè)務(wù)多維度實時透視。在全量數(shù)據(jù)上如何進行任意維度的查詢在一般的離線數(shù)倉中是很難做到的,往往需要業(yè)務(wù)重復(fù)地提出取數(shù)需求。在車點通,業(yè)務(wù)可以自主地進行透視,這里面整個流程最重要的就是大數(shù)據(jù)引擎支持,如果一個維度就需要幾分鐘,就會嚴重影響用戶使用積極性。

第三,把數(shù)據(jù)問題融入到運營當(dāng)中。在車點通中,系統(tǒng)會自動把相關(guān)問題發(fā)送給相關(guān)負責(zé)人,按照時間點把所有問題變化、改進情況發(fā)送給業(yè)務(wù)進行比較。系統(tǒng)可以對每個問題進行追蹤,避免出現(xiàn)遺漏、沒有解決的情況。

第四,刪除將數(shù)據(jù)融入到輔助決策。系統(tǒng)可以為業(yè)務(wù)變化,提供一些趨勢分析,適時給業(yè)務(wù)一些費用調(diào)整或預(yù)測建議。上線車點通車險業(yè)務(wù)一站式智慧經(jīng)營及管控中心,半年時間一線業(yè)務(wù)人員在車點通內(nèi)追蹤了193個(建議虛化具體數(shù)字)目標業(yè)務(wù)模式,邊際成本平均下降建議虛化具體數(shù)字

整套流程可以使業(yè)務(wù)部門通過數(shù)據(jù)更加了解業(yè)務(wù),進行多維度技術(shù)分析,通過數(shù)據(jù)溝通幫助解決業(yè)務(wù)問題。

機器學(xué)習(xí)平臺

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

集智平臺秉持著BI與AI同一個系統(tǒng)的理念,當(dāng)我們從數(shù)據(jù)中知道了歷史的狀況,我們很自然地就想知道未來的情況并相對應(yīng)地進行策略地改變,為此眾安搭建了機器學(xué)習(xí)平臺。

眾安保險智能中心孫谷飛:如何搭建一個“體系化”的數(shù)據(jù)中臺?

這個平臺主要讓機器學(xué)習(xí)模型落地更加簡單。

傳統(tǒng)路徑需要數(shù)據(jù)人員和算法工程師先去數(shù)倉中找到數(shù)據(jù),再編輯到Python環(huán)境下運行。經(jīng)過一系列建模工作之后,再進行封裝。

而且算法人員寫的代碼往往達不到生產(chǎn)級別,需要配備相應(yīng)開發(fā)工程師幫助輔助優(yōu)化。優(yōu)化包括DOCKER、做鏡像、上線做A\Btest,上線之后還需要定期到生產(chǎn)系統(tǒng)中撈數(shù)據(jù),整個流程風(fēng)險點非常多,過程也非常長。

一套模型從訓(xùn)練到上線,往往需要數(shù)據(jù)工程師、算法人員、數(shù)據(jù)開發(fā)工程師至少三個角色,約兩周時間。

有了機器學(xué)習(xí)平臺之后,算法工程師可以直接在數(shù)據(jù)應(yīng)用空間中獲取數(shù)據(jù),平臺自動幫助分配DOCKER資源,保證DOCKER資源最終上線后的一致性,同時保證模型測試階段和模型上線階段環(huán)境以及數(shù)據(jù)的一致性。

在整個過程中,平臺主要解決幾個問題:

第一,幫助算法工程師快速申請資源,快速進行服務(wù)化,快速上線,進行數(shù)據(jù)回流,彌補算法工程師與應(yīng)用工程師的開發(fā)鴻溝;

第二,把建模數(shù)據(jù)和算法過程保存下來。以往數(shù)據(jù)資產(chǎn)可能只有數(shù)據(jù)表,隨著算法模型應(yīng)用和落地越來越多,模型資產(chǎn)也非常重要。包括用了什么算法,使用什么樣數(shù)據(jù),整個機器學(xué)習(xí)平臺可以起到快速上線和管理模型的作用。 

最后總結(jié)一下,眾安數(shù)據(jù)中臺三大體系——數(shù)據(jù)管理體系、數(shù)據(jù)流通體系以及數(shù)據(jù)價值體系。

數(shù)據(jù)中臺是什么?他不是單一的系統(tǒng)或平臺,實際是一整套管理體系。每家公司進行數(shù)據(jù)中臺建設(shè)的時候,也都有不一樣的矩陣選擇,但本質(zhì)上都符合一個邏輯,怎樣最大化把數(shù)據(jù)資產(chǎn)管理起來,讓數(shù)據(jù)更好流通,讓數(shù)據(jù)發(fā)揮價值。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

專注AI醫(yī)療的新勢力和投融資丨微信ID:Daniel-six
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說