0
本文作者: 張棟 | 2018-09-11 17:27 |
明略數(shù)據(jù)創(chuàng)始人、董事長吳明輝
近日,明略數(shù)據(jù)在京發(fā)布“行業(yè)AI大腦明智系統(tǒng)2.0”。這是時(shí)隔一年后,明略數(shù)據(jù)基于“明智系統(tǒng)1.0”做的一次全面技術(shù)升級。
相比明智系統(tǒng)1.0,打通“感知智能”是明智系統(tǒng)2.0的業(yè)界首創(chuàng)。
其通過“符號的力量”完成對于行業(yè)數(shù)據(jù)中所蘊(yùn)含知識的抽取、融合、推理、沉淀等一系列過程,實(shí)現(xiàn)數(shù)據(jù)的充分融合和碰撞挖掘,面向行業(yè)業(yè)務(wù)而構(gòu)建的AI大腦。
成立于2014年的明略數(shù)據(jù),是一家大數(shù)據(jù)&人工智能解決方案公司,他們深耕公共安全、金融、工業(yè)與數(shù)字城市等領(lǐng)域,從最初的大數(shù)據(jù)平臺轉(zhuǎn)型為“AI驅(qū)動(dòng)的數(shù)據(jù)治理“,發(fā)展到今天打通感知與認(rèn)知智能,擁有完整的行業(yè)AI產(chǎn)品與解決方案體系。
其A輪融資發(fā)生在2015年,獲得硅谷天堂近億元投資;2016年8月獲得2億人民幣B輪融資,紅杉中國領(lǐng)投,分享投資、任子行以及硅谷天堂跟投;并已于去年完成10億人民幣C輪融資,華興新經(jīng)濟(jì)基金、騰訊產(chǎn)業(yè)共贏基金是本輪投資方。
從過往來看,大部分AI創(chuàng)業(yè)公司都在做一件事:take X;add AI。明略數(shù)據(jù)也不例外,但是明略在數(shù)據(jù)治理方面的優(yōu)勢使其走出一條不同的路。
他們是將企業(yè)數(shù)據(jù)構(gòu)建成一個(gè)知識圖譜,然后通過行業(yè)AI應(yīng)用去實(shí)現(xiàn)人機(jī)同行,找到其中的數(shù)據(jù)價(jià)值。總結(jié)來說,就是利用數(shù)據(jù)為企業(yè)、組織打造知識圖譜,然后利用AI提升業(yè)務(wù)效率。
以最新發(fā)布的AI產(chǎn)品&解決方案體系“明智系統(tǒng)2.0”來說。它的治理工具和NLP處理架構(gòu)都是基于分布式框架運(yùn)行,以更好處理數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜的問題。
明略數(shù)據(jù)創(chuàng)始人、董事長吳明輝告訴雷鋒網(wǎng),它主要由兩大部分組成:感知和認(rèn)知。
與明智系統(tǒng)1.0相比,各類數(shù)據(jù)在升級的明智系統(tǒng)2.0中匯聚,進(jìn)入“符號化”的過程,實(shí)現(xiàn)數(shù)據(jù)的充分融合和碰撞挖掘,從而有效的面向行業(yè)業(yè)務(wù)構(gòu)建行業(yè)AI大腦,由此,明智系統(tǒng)2.0通過“符號的力量”完成對于行業(yè)數(shù)據(jù)中所蘊(yùn)含知識的抽取、融合、推理、和沉淀等一系列過程,打通感知智能。
強(qiáng)化認(rèn)知智能是明智系統(tǒng)2.0的升級亮點(diǎn)。多元異構(gòu)數(shù)據(jù)通過強(qiáng)大的動(dòng)態(tài)索引及知識分析技術(shù)被充分融合,在此基礎(chǔ)上邏輯推理及復(fù)雜運(yùn)算得以開展。基于語義的分析檢索等各類場景應(yīng)用可以通過強(qiáng)大的引擎“明察”被加速完成。
同時(shí),企業(yè)級Siri“小明”作為人機(jī)交互入口,極簡易用,也是明智系統(tǒng)一大亮點(diǎn)。
在這其中,最值得一提的是由明略數(shù)據(jù)自主研發(fā)的混合型知識存儲數(shù)據(jù)庫—NEST存儲。
通常,傳統(tǒng)數(shù)據(jù)庫需要有DBA背景才可用,數(shù)據(jù)存儲以結(jié)構(gòu)化為主且有數(shù)據(jù)量限制,不易拓展。另外,存儲數(shù)據(jù)對象為陳述性知識,搜索代碼繁瑣,仍需人工推理,知識調(diào)取效率低。
相比之下,明略數(shù)據(jù)知識圖譜數(shù)據(jù)庫“NEST”,通過分布式知識圖譜,存儲陳述性和程序性知識,不僅存儲多元異構(gòu)的大規(guī)模數(shù)據(jù),還能存儲基于數(shù)據(jù)的規(guī)則與模型,除了解決“做什么”的問題,還能提示人類該“如何做”。
用吳明輝的話說,明略系統(tǒng)2.0的高能之處在于能夠加之輔助分析,從而進(jìn)行自動(dòng)推理,以有效節(jié)約客戶知識調(diào)用的時(shí)間。即便是非計(jì)算機(jī)專業(yè)的普通用戶也能應(yīng)用自如。
從“做什么”到“如何做”。簡單的三字轉(zhuǎn)承涵蓋了多數(shù)AI研究者畢生的努力方向,但就目前來說,想要完美跨越還較為復(fù)雜。
以AI較為中意的安防領(lǐng)域舉例來說,在模擬、數(shù)字時(shí)代,安防攝像頭都在“傻瓜式”地“工作”,不知‘自己’需要抓拍行人、車輛還是其他事物,也不知‘自己’已經(jīng)處于何種環(huán)境之中。
賦予AI智能之后,普通IPC便有了一些智能,能夠有效提升攝像頭的工作效率及使用效果。但與此同時(shí)又會出現(xiàn)一個(gè)問題:每一個(gè)攝像頭每天都會存儲海量多元數(shù)據(jù),如何針對單一數(shù)據(jù)做數(shù)據(jù)關(guān)聯(lián)并給出快速反應(yīng),考驗(yàn)著所有的AI安防從業(yè)者。
類比人類,每一個(gè)智能節(jié)點(diǎn)(IPC)都相當(dāng)于一個(gè)大腦,每天大腦都會接受海量的包括視頻、音頻、文字、圖片等多元數(shù)據(jù)。如果這些繁雜的數(shù)據(jù)處理不得當(dāng),很容易讓人產(chǎn)生負(fù)荷,甚至奔潰。
在吳明輝看來,如果將這些海量的重要信息轉(zhuǎn)化為“符號”,再配以“感知系統(tǒng)”,人們小小的大腦空間就可以儲存眾多復(fù)雜信息。
他解釋說,符號是人類認(rèn)知的基礎(chǔ)。AI最底層的包括知識工程、知識圖譜都是其中的符號化的核心個(gè)體組成。
在具體應(yīng)用中,這些被符號化的數(shù)據(jù)信息是可以極大提高后臺運(yùn)算效率的基礎(chǔ)元素。而最終所有的符號匯聚,也就形成了上文所提的NEST蜂巢知識圖譜數(shù)據(jù)庫。
在這個(gè)數(shù)據(jù)庫中,存儲著各種各樣的文本、視頻、音頻等多媒體數(shù)據(jù)。當(dāng)這個(gè)數(shù)據(jù)足夠多時(shí),它不再是簡單的處理系統(tǒng),而是有了像人的左右腦一樣的完整系統(tǒng)。之后,系統(tǒng)也可以像人類一樣有邏輯地去推理和思考。
比如說“他是誰”這個(gè)問題,明略數(shù)據(jù)該系統(tǒng)就可以把“他是誰”“翻譯”成真正的與身份特征相關(guān)的包括身份證號、護(hù)照號、手機(jī)號等在內(nèi)的ID,這些信息都可以在后臺通過符號化處理的數(shù)據(jù)結(jié)構(gòu)進(jìn)行索引,并馬上搜索出來。
換句話說,“認(rèn)知” 就是知道誰是誰,感知就能知道他的關(guān)系構(gòu)成(自我思考)。AI及知識圖譜的連接可以將感知和認(rèn)知聯(lián)結(jié)在一起,組成新一代完整的人工智能系統(tǒng)。
談到這里,也許很多人對于“感知”還是比較陌生,其實(shí)感知智能在我們的日常生活中已經(jīng)無時(shí)無刻地存在著:
譬如智能音箱,用戶通過語音控制音箱播放或者暫停歌曲并非智能。真正的智能音箱應(yīng)該能夠以“更好地發(fā)聲”為前提,通過對環(huán)境的感知,為用戶展示最好的聆聽效果。
比如蘋果的HomePod音箱,它可根據(jù)聲音折射,‘知道’自己被放置在一個(gè)多大的空間中,以及在空間的哪個(gè)位置,從而自動(dòng)調(diào)節(jié)它自身的五個(gè)發(fā)聲單元,為用戶呈現(xiàn)最佳的音響效果。
譬如空調(diào),它并非自動(dòng)根據(jù)室外溫度而自動(dòng)調(diào)節(jié)送風(fēng)模式。而是能夠通過前端的兩個(gè)攝像頭,知曉房間的大小、人數(shù)、這些人是運(yùn)動(dòng)的還是靜止的、體溫狀況、房間有無陽光直射等環(huán)境。然后通過對這些外部環(huán)境的感知,改變其送風(fēng)模式及溫度;
如此等等。
只是這一次,明略數(shù)據(jù)將感知能力賦予城市AI大腦中以更好打通數(shù)據(jù)閉環(huán)。
吳明輝表示, 以往,大多數(shù)AI公司會聚焦在某一個(gè)技術(shù)環(huán)節(jié),而沒有人真正的把完整的人工智能串聯(lián)起來,而明略數(shù)據(jù)要做的便是整合服務(wù),要做的就是將數(shù)據(jù)‘深度’結(jié)構(gòu)化。
這個(gè)過程實(shí)際上就是在構(gòu)建行業(yè)的知識體系,很多行業(yè)知識是之前行業(yè)專家沉淀出來的,他們要利用AI將這些數(shù)據(jù)變?yōu)橹R經(jīng)濟(jì)。
他篤信,所有的感知計(jì)算本質(zhì)上來說都是在給認(rèn)知計(jì)算提供數(shù)據(jù)基礎(chǔ)。明略數(shù)據(jù)推出的這個(gè)系統(tǒng)從某種意義上來說已經(jīng)打通了感知計(jì)算、認(rèn)知計(jì)算、感知智能、認(rèn)知智能,形成真正的人工智能的閉環(huán)。
作為大數(shù)據(jù)與人工智能獨(dú)角獸,明略數(shù)據(jù)在業(yè)界首創(chuàng)“符號主義和深度學(xué)習(xí)有效結(jié)合”人工智能頂層設(shè)計(jì),在其行業(yè)AI大腦“明智系統(tǒng)2.0”中打通感知與認(rèn)知智能,以推動(dòng)人機(jī)同行,讓AI真正創(chuàng)造商業(yè)與社會價(jià)值。
過去四年時(shí)間,明略數(shù)據(jù)憑借此已在全國服務(wù)了幾十個(gè)省市的公安局,為公安客戶實(shí)現(xiàn)5-20%的破案率的提升。
在金融行業(yè)的實(shí)踐中,他們完成了全國首個(gè)銀行業(yè)全行級知識圖譜數(shù)據(jù)庫。在某全國大型股份制銀行項(xiàng)目中,依托全行近十年全量數(shù)據(jù),構(gòu)建了“企業(yè)、個(gè)人、機(jī)構(gòu)、賬戶、交易和行為數(shù)據(jù)”總規(guī)模達(dá)十億點(diǎn)、百億邊的知識圖譜平臺。該平臺突破性地展現(xiàn)了全行完整的客戶關(guān)系網(wǎng)及資金流轉(zhuǎn)全貌,完善了銀行整體風(fēng)險(xiǎn)管理能力,提升了銀行風(fēng)控效率。
在城市軌道交通領(lǐng)域,明略數(shù)據(jù)服務(wù)上海地鐵車輛分公司實(shí)現(xiàn)國內(nèi)首個(gè)車輛全生命周期數(shù)據(jù)管理的智能化平臺。他們通過幫助軌交運(yùn)營單位有效提高工作效率,降低安全風(fēng)險(xiǎn)和運(yùn)營成本,助力軌道交通行業(yè)向信息化、智能化邁進(jìn)。
可以說,明略數(shù)據(jù)在推動(dòng)安防、金融、工業(yè)、數(shù)字城市等領(lǐng)域的智能化升級方面積累了豐富的技術(shù)解決方案與成功案例。
未來,他們還要基于這些數(shù)據(jù)去做完整的AI大腦,包括公安大腦、工業(yè)安全大腦、金融風(fēng)控大腦,數(shù)字城市大腦等等。
“當(dāng)然,在這個(gè)行進(jìn)過程中肯定會遇到技術(shù)同質(zhì)化的問題,AI算法在上個(gè)世紀(jì)就已成熟,只是缺乏足夠的數(shù)據(jù)和計(jì)算資源來支持?!眳敲鬏x總結(jié)說。
“但所有的程序都離不開數(shù)據(jù)模型,AI算法更需要基于對數(shù)據(jù)的理解?;诖耍髀詳?shù)據(jù)將持續(xù)理解行業(yè)業(yè)務(wù),構(gòu)建領(lǐng)域知識圖譜,將知識圖譜與AI算法相結(jié)合,構(gòu)建企業(yè)AI大腦,從而完成人工智能的可復(fù)制應(yīng)用?!?span style="color: #FFFFFF;">雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。