成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

圖數(shù)據(jù)庫與關(guān)系數(shù)據(jù)庫的實驗對比——意大利商會 InfoCamere 案例

ygyooo / 3530人閱讀

摘要:意大利商會通過遍布全國的多個分支機構(gòu)來服務(wù)和促進(jìn)意大利企業(yè)的公共機構(gòu)信息交流。這項工作是基于意大利企業(yè)注冊摘要獲得的數(shù)據(jù)集,并包含有關(guān)企業(yè)參股的數(shù)據(jù)。

摘要:
InfoCamere是附屬于意大利商會的IT公司,主要設(shè)計和開發(fā)最新和創(chuàng)新的IT解決方案和服務(wù),它通過一個公眾也可以訪問的網(wǎng)絡(luò)連接商會及其數(shù)據(jù)庫。借助InfoCamere,意大利和國外的企業(yè),公共機構(gòu),行業(yè)協(xié)會,專業(yè)團體和簡單的公民可以輕松獲取在意大利注冊和運營的所有業(yè)務(wù)的最新官方信息和經(jīng)濟數(shù)據(jù)。
意大利商會通過遍布全國的300多個分支機構(gòu)來服務(wù)和促進(jìn)意大利企業(yè)的公共機構(gòu)信息交流。InfoCamere
是商會的服務(wù)系統(tǒng),幫助他們實現(xiàn)商業(yè)利益。在實施意大利數(shù)字化議程方面發(fā)揮了關(guān)鍵作用,涉及到國家生產(chǎn)系統(tǒng)的數(shù)字化轉(zhuǎn)型過程,特別是支持中小企業(yè)的數(shù)字化。
實驗案例由 Luca Sinico (InfoCamere 軟件開發(fā)人員) 負(fù)責(zé)編寫。

實驗概述

InfoCamere 于二零一六年下半年展開圖形數(shù)據(jù)庫領(lǐng)域的檢驗工作,工作的目的是對該技術(shù)的主要特性進(jìn)行調(diào)查; 在概念和性能方面比較市場上的一些可用產(chǎn)品以及關(guān)系解決方案;并檢查一些InfoCamere應(yīng)用程序的圖形數(shù)據(jù)庫的采用可能性。這項工作是基于意大利企業(yè)注冊摘要獲得的數(shù)據(jù)集,并包含有關(guān)企業(yè)參股的數(shù)據(jù)。圖的節(jié)點可以是自然人或公司,并且收集關(guān)于面額,公司的股本,注冊國家,唯一的財政標(biāo)識符等的數(shù)據(jù)。圖的邊緣代表其中的股權(quán)參與。

在我們的工作中,我們檢查了兩種主要類型的圖形數(shù)據(jù)模型,即“屬性圖”和“RDF”。盡管RDF(W3C標(biāo)準(zhǔn))代表了實現(xiàn)鏈接數(shù)據(jù)和語義Web的有效方法,盡管它以圖形的形式組織數(shù)據(jù),但是我們發(fā)現(xiàn)屬性圖模型(一種“行業(yè)標(biāo)準(zhǔn)”)能更好地滿足我們的要求。實際上,它允許在邊上定義屬性。而RDF不允許直接使用它。另外,針對RDF(SPARQL)提出的標(biāo)準(zhǔn)查詢語言對于通常由支持“屬性圖”模型的DBMS提供的查詢語言顯示出一些限制。兩個簡單的例子是缺少最短路徑計算函數(shù),并且可能為可變長度路徑搜索表示最大深度級別。

數(shù)據(jù)進(jìn)入圖形數(shù)據(jù)庫的流程如圖2所示。從存儲意大利商業(yè)注冊的復(fù)雜關(guān)系數(shù)據(jù)庫開始,通過用戶需求或更新操作不斷產(chǎn)生一些標(biāo)題搜索。標(biāo)題搜索保存通過組合不同表中的不同記錄獲得的匯總數(shù)據(jù),這對于某些應(yīng)用是有用的。正因為如此,這些數(shù)據(jù)放在關(guān)系數(shù)據(jù)庫上以支持其操作。由于這個第二關(guān)系數(shù)據(jù)庫主要集中在與公司參股相關(guān)的方面,圖形數(shù)據(jù)庫從中獲取數(shù)據(jù)。

查詢

我們開發(fā)的查詢可以被這些數(shù)據(jù)集上的應(yīng)用程序所使用,也可以稍微強調(diào)數(shù)據(jù)庫管理系統(tǒng)的能力。特別是我們開發(fā)了一些標(biāo)準(zhǔn)查詢和一些更具體的查詢。
鑒于一個特定的公司,由其“財政ID”確定,我們要求其員工;它的參與;或兩者同時;從而通過將搜索限制到僅一個深度級別。但是,我們也要求直接和間接參與一家公司(同樣也是為了同事)。這對應(yīng)于沒有深度限制的圖的探索。此外,由于數(shù)據(jù)集構(gòu)成一個圖(而不是“簡單”樹),兩家公司之間的路徑可能是多個。這使我們要求提供連接兩家公司的完整的直接路徑列表;或者,也可以是最短的一個。我們還要求兩家公司的共同參與(或同事)。數(shù)據(jù)集的圖形性質(zhì)也導(dǎo)致了另外兩個查詢的制定:第一個返回與檢索到的參與節(jié)點一起, 并且檢索到的深度值降低; 第二個查詢計算每個深度級別的與給定節(jié)點的關(guān)聯(lián)公司,但是避免對它們進(jìn)行多次計數(shù)。
查詢的開發(fā)有助于調(diào)查目的和更好的數(shù)據(jù)探索體驗。

圖形數(shù)據(jù)庫與關(guān)系數(shù)據(jù)庫的比較

我們將數(shù)據(jù)集導(dǎo)入了三個最知名的圖形數(shù)據(jù)庫,分別是ArangoDB v3.0.10; Neo4j v3.0.6;和OrientDB v2.2.11(均為社區(qū)版)。我們還將數(shù)據(jù)集導(dǎo)入了一個眾所周知的關(guān)系數(shù)據(jù)庫:PostgreSQL v9.6.1。關(guān)系型數(shù)據(jù)庫的選擇沒有強烈的約束,因為性能主要受SQL語言性能的影響。這些產(chǎn)品已經(jīng)安裝在虛擬服務(wù)器上,資源適中,因此對于其他類似硬件可用性的公司來說,結(jié)果也是有用的。對于每一種查詢,我們選擇了三個代表三種不同負(fù)載的DBMS的三個節(jié)點。特別是:一個節(jié)點表示一個輕量級的案例,可能較少的返回的結(jié)果,或者較短的勘探深度值; 一個節(jié)點代表中間的案例; 還有一個重量級的案例。我們不止一次地執(zhí)行了這些查詢,所以我們也研究了延遲加載的緩存之間的性能差異。

由于目前還沒有圖形數(shù)據(jù)庫的標(biāo)準(zhǔn)查詢語言,因此每個圖形DBMS都提供自己的查詢語言。這促使我們評估各種查詢語言的表達(dá)性和易用性。

結(jié)果

我們收集的結(jié)果概括如下:

圖表數(shù)據(jù)庫提供了一些特意設(shè)計的查詢語言,這些語言大大有助于描述圖遍歷查詢,也有助于應(yīng)對該領(lǐng)域的一些典型計算問題。使用SQL或借助存儲過程,相同的查詢很難以高效的方式實現(xiàn)。

雖然關(guān)系數(shù)據(jù)庫對較簡單的查詢執(zhí)行得很好,但對于圖挖掘查詢的重量級案例(即那些有大量待分析節(jié)點的數(shù)據(jù),并需要遍歷的高水平的值),分析顯示三個圖數(shù)據(jù)庫的性能通常要比關(guān)系型數(shù)據(jù)庫高出一個或兩個數(shù)量級。

ArangoDB顯示了良好的導(dǎo)入和查詢性能,尤其適用于輕量級和中等工作負(fù)載的情況。

關(guān)于ArangoDB 測試版本的關(guān)注點之一就是內(nèi)存占用 RAM
greedy。然而,ArangoDB聲稱已經(jīng)用他們新的3.2版本和新的RocksDB存儲引擎解決了這個“問題”。

實驗結(jié)論

由于在研究工作中得到了良好的反饋,在導(dǎo)入和執(zhí)行時間方面表現(xiàn)良好,文檔良好,易于使用和商業(yè)價格合理,ArangoDB 在InfoCamere 的一些應(yīng)用程序中表現(xiàn)出了很好的潛力。最終,我們決定在我們正在開發(fā)的演示應(yīng)用程序中使用ArangoDB。

關(guān)于比較實驗的一些額外細(xì)節(jié)可以在這里找到。

英文原文

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/27123.html

相關(guān)文章

  • 初學(xué)者怎么選擇神經(jīng)網(wǎng)絡(luò)環(huán)境?對比MATLAB、Torch和TensorFlow

    摘要:本報告面向的讀者是想要進(jìn)入機器學(xué)習(xí)領(lǐng)域的學(xué)生和正在尋找新框架的專家。其輸入需要重塑為包含個元素的一維向量以滿足神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)目前代表著用于圖像分類任務(wù)的較先進(jìn)算法,并構(gòu)成了深度學(xué)習(xí)中的主要架構(gòu)。 初學(xué)者在學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的時候往往會有不知道從何處入手的困難,甚至可能不知道選擇什么工具入手才合適。近日,來自意大利的四位研究者發(fā)布了一篇題為《神經(jīng)網(wǎng)絡(luò)初學(xué)者:在 MATLAB、Torch 和 ...

    yunhao 評論0 收藏0
  • 谷歌研究員兩萬字批駁上交大用深度學(xué)習(xí)推斷犯罪分子

    摘要:于年在意大利北部帕維亞的監(jiān)獄中死亡。的死亡促使了現(xiàn)代犯罪學(xué)的誕生。寫道,犯罪分子生下來就是罪犯。最近的一個例子便是,上海交通大學(xué)和在年月傳到上的論文使用臉部圖像自動推斷罪犯。 任何關(guān)心如何確保 AI 技術(shù)朝著有利于人類發(fā)展的人都是本文的讀者1844 年,意大利南部一個小城鎮(zhèn)舉辦了一場審判會,一個名叫 Giuseppe Villella 的勞工因涉嫌竊取了5 個里考塔(注釋:意大利奶制品,類似...

    kevin 評論0 收藏0
  • NLP 頂級科學(xué)家 Manning:深度學(xué)習(xí)將主導(dǎo) SIGIR(信息檢索)

    摘要:于月日至日在意大利比薩舉行,主會于日開始。自然語言理解領(lǐng)域的較高級科學(xué)家受邀在發(fā)表主旨演講。深度學(xué)習(xí)的方法在這兩方面都能起到作用。下一個突破,將是信息檢索。深度學(xué)習(xí)在崛起,在衰退的主席在卸任的告別信中這樣寫到我們的大會正在衰退。 SIGIR全稱ACM SIGIR ,是國際計算機協(xié)會信息檢索大會的縮寫,這是一個展示信息檢索領(lǐng)域中各種新技術(shù)和新成果的重要國際論壇。SIGIR 2016于 7月17...

    Reducto 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<