摘要:圖數(shù)據(jù)庫逐步成為目前主要的知識圖譜存儲方式。知識圖譜的補全是通過現(xiàn)有知識圖譜來預測實體之間的關系,是對關系抽取的重要補充。相關資料大規(guī)模知識圖譜的構(gòu)建推理及應用肖仰華大規(guī)模知識圖譜構(gòu)建與應用
知識圖譜怎么去做,這當然不是幾句話說得清楚的。首先肯定要先基于自身的業(yè)務進行思考,這里整理一些知識圖譜構(gòu)建的主要路徑。
構(gòu)建的邏輯思路1、梳理業(yè)務,構(gòu)建本體:是否需要用知識圖譜?成本怎么樣,能達到怎么的效果?是否有能力構(gòu)建知識圖譜?數(shù)據(jù)、團隊等情況是否能支撐?如果有必要,如何根據(jù)業(yè)務梳理一套本體框架?
2、編輯本體,給出業(yè)務知識表示框架:可以利用Protege進行本體編輯,獲得一個用OWL表示的知識表示文件。
3、給本體補充實例數(shù)據(jù):先找一些示例數(shù)據(jù),便于理解。
構(gòu)建的不同方式自頂向下的構(gòu)建方式:先定義本體和數(shù)據(jù)模式,再將實體加入知識庫。利用一些現(xiàn)有的結(jié)構(gòu)化知識庫作為其基礎知識庫。
自底向上的構(gòu)建方式:從一些開放鏈接數(shù)據(jù)中提取出實體,選擇其中置信度較高的加入到知識庫,再構(gòu)建頂層的本體模式。
構(gòu)建過程中的關鍵技術大體包含五個方面:知識抽取、知識表示、知識融合、知識加工、知識評估
通過知識提取技術,可以從一些公開的半結(jié)構(gòu)化、非結(jié)構(gòu)化和第三方結(jié)構(gòu)化數(shù)據(jù)庫的數(shù)據(jù)中提取出實體、關系、屬性等知識要素。
知識表示則通過一定有效手段對知識要素表示,便于進一步處理使用。分布式的知識表示形成的綜合向量對知識庫的構(gòu)建、推理、融合以及應用均具有重要的意義。
然后通過知識融合,可消除實體、關系、屬性等指稱項與事實對象之間的歧義,形成高質(zhì)量的知識庫。
知識加工則是在已有的知識庫基礎上進一步挖掘隱含的知識,構(gòu)建新本體,補全關系,從而豐富、擴展知識庫。
知識評估可以對知識的可信度進行量化,保留置信度較高的,舍棄置信度較低的,有效確保知識的質(zhì)量。
除此之外,大規(guī)模知識圖譜構(gòu)建,還需要多種技術的支持:分布式存儲和計算、圖數(shù)據(jù)庫、圖推理、內(nèi)存數(shù)據(jù)庫等。
數(shù)據(jù)的存儲數(shù)據(jù)庫選擇知識圖譜的存儲和查詢語言也經(jīng)歷了歷史的洗滌,從RDF到OWL以及SPARQL查詢,都逐漸因為使用上的不便及高昂的成本,而被工業(yè)界主流所遺棄。
圖數(shù)據(jù)庫逐步成為目前主要的知識圖譜存儲方式。
目前應用比較廣泛的圖數(shù)據(jù)庫包括Neo4j、graphsql、sparkgraphx(包含圖計算引擎)、基于hbase的Titan、BlazeGraph等,各家的存儲語言和查詢語言也不盡相同。
實際應用場景下,OrientDB和postgresql也有很多的應用,主要原因是其相對低廉的實現(xiàn)成本和性能優(yōu)勢。
應用推理和知識自學習在知識圖譜構(gòu)建過程中,還存在很多關系補全問題。雖然一個普通的知識圖譜可能存在數(shù)百萬的實體和數(shù)億的關系事實,但相距補全還差很遠。
知識圖譜的補全是通過現(xiàn)有知識圖譜來預測實體之間的關系,是對關系抽取的重要補充。
傳統(tǒng)方法TransE和TransH通過把關系作為從實體A到實體B的翻譯來建立實體和關系嵌入,但是這些模型僅僅簡單地假設實體和關系處于相同的語義空間。
而事實上,一個實體是由多種屬性組成的綜合體,不同關系關注實體的不同屬性,所以僅僅在一個空間內(nèi)對他們進行建模是不夠的。
相關資料大規(guī)模知識圖譜的構(gòu)建、推理及應用
肖仰華 | 大規(guī)模知識圖譜構(gòu)建與應用
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/74870.html
摘要:月日,由阿里云與上海瑞金醫(yī)院阿里健康聯(lián)合舉辦的新一輪天池大賽瑞金醫(yī)院人工智能輔助構(gòu)建知識圖譜大賽決賽結(jié)果頒布,兩位來自哈工大的歲研究生在全球近位開發(fā)者當中脫穎而出,獲得冠軍。3月1日,由阿里云與上海瑞金醫(yī)院、阿里健康聯(lián)合舉辦的新一輪天池大賽——瑞金醫(yī)院MMC人工智能輔助構(gòu)建知識圖譜大賽決賽結(jié)果頒布,兩位來自哈工大的22歲研究生在全球近2000位開發(fā)者當中脫穎而出,獲得冠軍。 熱點熱議 阿里...
摘要:如果在學習過程中有什么問題可以關注我公眾號琉憶編程庫給我留言。有興趣可以深入學習最后附上學習的知識結(jié)構(gòu)圖譜,可以按著下面的這個知識結(jié)構(gòu)圖進行學習不一定完整,更多資料,面試題,都可以關注公眾號琉憶編程庫獲取。 你好,是我——琉憶。PHP程序員面試系列圖書作者。 作為一名PHP開發(fā)者過來人,也是經(jīng)歷了菜鳥到老手的過程,在此給那些想學PHP的同學指條路,即使你是轉(zhuǎn)行學PHP一樣可以學會PHP...
閱讀 1910·2021-11-24 09:39
閱讀 2575·2021-10-14 09:43
閱讀 3333·2021-10-08 10:10
閱讀 2355·2021-09-22 15:54
閱讀 2353·2019-08-29 17:20
閱讀 1585·2019-08-28 18:14
閱讀 2385·2019-08-26 13:28
閱讀 1127·2019-08-26 12:16