0
本文作者: AI研習(xí)社-譯站 | 2020-12-05 09:54 |
雙語(yǔ)原文鏈接:What’s the Difference Between an Ontology and a Knowledge Graph?
隨著語(yǔ)義應(yīng)用程序成為業(yè)界越來(lái)越熱門(mén)的話題,客戶(hù)經(jīng)常來(lái)EK詢(xún)問(wèn)有關(guān)本體和知識(shí)圖譜的問(wèn)題。具體來(lái)說(shuō),他們想知道兩者之間的區(qū)別。本體和知識(shí)圖譜是一回事嗎?它們有何不同??jī)烧咧g是什么關(guān)系?
在這篇博客中,我將引導(dǎo)您了解本體和知識(shí)知識(shí)圖譜,講述它們之間的區(qū)別以及它們?nèi)绾谓M織大量數(shù)據(jù)和信息。
本體是語(yǔ)義數(shù)據(jù)模型,用于定義domain中事物的類(lèi)型以及可用于描述它們的屬性。本體是廣義的數(shù)據(jù)模型,這意味著它們僅對(duì)具有某些屬性的事物的一般類(lèi)型進(jìn)行建模,而并不包含有關(guān)我們domain中具體個(gè)體的信息。例如,本體論不能描述您的狗,斑點(diǎn)和它的所有個(gè)體特征,主要描述狗的一般概念,嘗試描述大多數(shù)狗可能具有的特征。這樣做可以使我們?cè)趯?lái)用本體來(lái)描述其他狗。
本體有三個(gè)主要組成部分,通常描述如下:
類(lèi): 存在于數(shù)據(jù)中的不同類(lèi)型的。
關(guān)系:連接兩個(gè)類(lèi)的屬性。
屬性:描述單個(gè)類(lèi)的屬性。
例如,假設(shè)我們有以下關(guān)于書(shū)籍、作者和出版商的信息:
首先,我們要標(biāo)識(shí)類(lèi)(數(shù)據(jù)中事物的唯一類(lèi)型)。這個(gè)示例數(shù)據(jù)似乎捕獲了關(guān)于書(shū)籍的信息,因此它是類(lèi)的一個(gè)很好的候選項(xiàng)。具體來(lái)說(shuō),示例數(shù)據(jù)捕獲了關(guān)于書(shū)籍的某些類(lèi)型的內(nèi)容,比如作家和出版商。再深入一點(diǎn),我們可以看到我們的數(shù)據(jù)還捕獲了關(guān)于出版商和作者的信息,比如他們的位置。這給我們留下了這個(gè)例子中的四個(gè)類(lèi):
書(shū)籍
作者
出版商
位置
下一步,我們需要標(biāo)識(shí)關(guān)系和屬性(為了簡(jiǎn)單,我們可以將關(guān)系和實(shí)體屬性都視為屬性)。使用我們?cè)谥岸x的類(lèi),我們可以查看數(shù)據(jù)并開(kāi)始列出我們看到的每個(gè)類(lèi)的所有屬性。例如,在書(shū)籍類(lèi)中,一些屬性可能是:
書(shū)籍有作者
書(shū)籍有出版商
書(shū)集是在一個(gè)日期出版的
書(shū)籍之后有續(xù)集(其他書(shū))
其中一些屬性是連接兩個(gè)類(lèi)的關(guān)系。例如,關(guān)系屬性“書(shū)籍有作者”是一個(gè)連接書(shū)籍類(lèi)和作者類(lèi)的關(guān)系。其他屬性,像“書(shū)籍發(fā)布的日期”是實(shí)體屬性,只描述一個(gè)類(lèi),而不是將兩個(gè)類(lèi)連接在一起。
需要注意的是,這些屬性可能適用于任何給定的書(shū)籍,但它們不一定適用于每一本書(shū)。例如,很多書(shū)都沒(méi)有續(xù)集。這在我們的本體中很好,因?yàn)槲覀冎皇窍氪_保我們捕獲了可能適用于許多(但不一定是所有)書(shū)籍的屬性。
雖然上面的屬性列表很容易閱讀,但是重寫(xiě)這些屬性以更清楚地定義我們的類(lèi)和屬性會(huì)有所幫助。例如,“書(shū)籍有作者”可以寫(xiě)成:
書(shū)→有作者→作者
盡管你可以包括更多的屬性,這取決于你的用例,對(duì)于這個(gè)博客,我已經(jīng)定義了以下屬性:
書(shū)→有作者→作者
書(shū)→有出版商→出版商
書(shū)→出版于→出版日期
書(shū)→后面是→書(shū)
出版商 →位于→位置
位置→位于→位置
記住,我們的本體是一個(gè)通用的數(shù)據(jù)模型,這意味著我們不想在本體中包含關(guān)于特定書(shū)籍的信息。相反,我們希望創(chuàng)建一個(gè)可重用的框架,將來(lái)我們可以用它來(lái)描述其他書(shū)籍。
當(dāng)我們結(jié)合類(lèi)和關(guān)系時(shí),我們能夠以圖的形式查看本體:
使用本體作為一個(gè)框架,我們可以添加關(guān)于個(gè)別書(shū)籍、作者、出版商和位置的真實(shí)數(shù)據(jù)來(lái)創(chuàng)建一個(gè)知識(shí)圖譜。利用上面表中的信息和本體,我們可以創(chuàng)建每個(gè)本體關(guān)系的特定實(shí)例。比如,如果我們的本體中有這樣的關(guān)系“書(shū)籍→有作者→作者”,這個(gè)關(guān)系的單個(gè)實(shí)例如下:
如果我們把我們擁有的關(guān)于《殺死一只知更鳥(niǎo)》這本書(shū)的所有信息加進(jìn)去,我們可以看到知識(shí)圖譜的開(kāi)端:
如果我們對(duì)所有的數(shù)據(jù)都這么做,我們最終會(huì)得到一個(gè)使用本體對(duì)數(shù)據(jù)進(jìn)行編碼的圖。通過(guò)使用知識(shí)圖譜,我們可以將數(shù)據(jù)看作一個(gè)關(guān)系網(wǎng)絡(luò),而不是作為單獨(dú)的表格在我們無(wú)法理解的數(shù)據(jù)點(diǎn)間繪制新的連接。具體來(lái)說(shuō),使用SPARQL,我們可以查詢(xún)數(shù)據(jù)和使用推理功能(讓知識(shí)圖譜建立之前沒(méi)有定義的連接)。
正如你在上面例子中所看的,當(dāng)你將本體(我們的數(shù)據(jù)模型)應(yīng)用到一組單獨(dú)的數(shù)據(jù)點(diǎn)(書(shū)籍、作者和出版商數(shù)據(jù))時(shí),那么就是創(chuàng)建了一個(gè)知識(shí)圖譜。換句話說(shuō):
本體+數(shù)據(jù)=知識(shí)圖譜
AI研習(xí)社是AI學(xué)術(shù)青年和AI開(kāi)發(fā)者技術(shù)交流的在線社區(qū)。我們與高校、學(xué)術(shù)機(jī)構(gòu)和產(chǎn)業(yè)界合作,通過(guò)提供學(xué)習(xí)、實(shí)戰(zhàn)和求職服務(wù),為AI學(xué)術(shù)青年和開(kāi)發(fā)者的交流互助和職業(yè)發(fā)展打造一站式平臺(tái),致力成為中國(guó)最大的科技創(chuàng)新人才聚集地。
如果,你也是位熱愛(ài)分享的AI愛(ài)好者。歡迎與譯站一起,學(xué)習(xí)新知,分享成長(zhǎng)。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。