數(shù)據(jù)庫分區(qū)是什么？

vboy1010 2022-06-28 14:08 回答0 收藏1

收藏問題

3條回答

huashiou

回答于2022-06-28 14:08

關(guān)于數(shù)據(jù)庫分區(qū)，分表，分庫，我通俗易懂的來舉幾個栗子，看過還不懂，你打我。。。

村里一家四口人(老爹叫A)有兩兒子(分別是A1，A2)，長大了要自己種地了，就嚷嚷著要分家，把村東的一塊地給大兒子A1，村西的給二兒子A2，但是這時候戶口本上記錄的還是一家四口(對外顯示還是一家人)，國土局統(tǒng)計村西土地面積的時候直接讓A去匯報，然后A去讓A2測量并匯報，不涉及到A1！

這就是分區(qū):對外只展示一張表，但是表內(nèi)部分區(qū)到不同的磁盤上，只需要其中一部分?jǐn)?shù)據(jù)的時候可直接映射相應(yīng)的區(qū)進(jìn)行查找，避免了全表掃描，提升了查找，插入數(shù)據(jù)的性能，一般是數(shù)據(jù)庫層面實現(xiàn)的，如下圖所示:

分區(qū)可分為水平分區(qū)和垂直分區(qū)，通常水平分區(qū)用的比較多，算法有按照某個字段的大小等，某個字段的hash分等等！

啥是分表呢？還是上面那一家子，分家了之后，戶口也變了，變成了三家，國土局讓上報數(shù)據(jù)的時候，需要分別通知三家進(jìn)行，比如只需要村西的統(tǒng)計，那么還是只用找二兒子A2就行了(三家已經(jīng)是多帶帶的數(shù)據(jù)庫表了)

分表:對外展示多張小表，業(yè)務(wù)代碼訪問之前，需要先通過計算分表策略算法，來選擇具體訪問哪一張表，和分區(qū)一樣，避免了全表的訪問，分表如下圖示:

分庫:跟分表有異曲同工之妙，但是分庫的級別為數(shù)據(jù)庫級別(按上面的例子，就得提升到村子級別了)，簡單來說就算是你一個庫是關(guān)系型數(shù)據(jù)庫，一個庫是nosql數(shù)據(jù)庫也是可以稱為分庫的，這對于庫的引擎，連接方式都可以有不同的實現(xiàn)！

分庫通常在不同的數(shù)據(jù)庫服務(wù)節(jié)點上，避免單庫宕機(jī)對全部數(shù)據(jù)服務(wù)帶來的影響，同時也提供了更大的數(shù)據(jù)庫并發(fā)能力！
關(guān)于分庫，分表，分區(qū)是不是很簡單？

現(xiàn)在分庫分表使用的更加的廣泛，業(yè)界也提供了大量成熟的數(shù)據(jù)庫中間件來提供分庫分表，比如mycat，sharding-jdbc等等，只需要根據(jù)業(yè)務(wù)選擇合適的分庫分表策略，結(jié)合相應(yīng)組件就能輕松搭建起一個分庫分表數(shù)據(jù)服務(wù)，不過隨之而來的全局唯一數(shù)據(jù)，統(tǒng)計，連接查詢等才是更加需要關(guān)注的，更多的技術(shù)分享，敬請關(guān)注。。。

評論0 贊同0

加載中...

SmallBoyO

回答于2022-06-28 14:08

什么是分區(qū)？

數(shù)據(jù)庫分區(qū)一般指的是數(shù)據(jù)庫的表分區(qū)，下面我們以MYSQL為例來講解數(shù)據(jù)庫分區(qū)，其他數(shù)據(jù)庫道理基本相同。分區(qū)表對用戶來說是一個邏輯整體，但底層mysql將其分離為多個物理子表，分區(qū)對于sql來說是完全封裝的，也就是對我們應(yīng)用來說是透明的，不可見的，但從底層的文件系統(tǒng)來看，一個表被分割為多個子表文件，使用方法也很簡單，在創(chuàng)建表時使用 partition by 子句定義分區(qū)表達(dá)式來存放數(shù)據(jù)。

mysql執(zhí)行查詢時候，優(yōu)化器先根據(jù)分區(qū)表達(dá)式的定義來過濾無用的分區(qū)，執(zhí)行sql時只需要查找包含需要的數(shù)據(jù)分區(qū)就可以了。

分區(qū)的原理？

分區(qū)表管理一組分區(qū)表和管理普通表一樣，各個子表的索引也是上加了一個人完全相同的索引，從存儲引擎來看，子表和一個獨立的普通表沒有任何區(qū)別，以下我們來看看當(dāng)執(zhí)行以下命令的時候mysql如何操作分區(qū)表的：

select ：查詢時，分區(qū)層打開并鎖住所有子表，優(yōu)化器先根據(jù)分區(qū)表達(dá)式過濾不需要的分區(qū)，然后調(diào)用存儲引擎訪問各個目標(biāo)分區(qū)。
insert：寫入時，分區(qū)層打開并鎖住所有子表，根據(jù)分區(qū)表達(dá)式確認(rèn)存放數(shù)據(jù)的分區(qū)是哪一個，再去指定分區(qū)插入記錄。
delete：刪除也是一樣，還是先鎖住所有分區(qū)，根據(jù)分區(qū)表達(dá)式確認(rèn)數(shù)據(jù)在哪一個分區(qū)，再去那個分區(qū)刪除記錄。
update：更新時相對復(fù)雜一點，分區(qū)層打開并鎖住所有子表，先根據(jù)分區(qū)表達(dá)式確認(rèn)數(shù)據(jù)在哪一個分區(qū)，然后先取出數(shù)據(jù)并更新，再判斷更新后的數(shù)據(jù)應(yīng)該存放哪個分區(qū)，最后對目標(biāo)分區(qū)寫入數(shù)據(jù)，最后一步要對原始數(shù)據(jù)的分區(qū)表進(jìn)行刪除操作。

分區(qū)類型有哪些？

范圍分區(qū)：使用partition by range（列的表達(dá)式）來表示，使用最多的分區(qū)表類型，每個分區(qū)存儲某個范圍內(nèi)的數(shù)據(jù)，比如：

列表分區(qū)：使用 partition by list（列的表達(dá)式）按離散值集合分區(qū)，這種分區(qū)類型類似于范圍分區(qū)，例如：

哈希分區(qū)：使用 partition by hash（列的表達(dá)式），按表達(dá)式的hashcode取模后分布到指定的區(qū)域，同理：

分區(qū)查詢優(yōu)化？

分區(qū)數(shù)據(jù)顯而易見的好處是數(shù)據(jù)分塊管理，大表拆小表，這樣在操作數(shù)據(jù)的時候可以預(yù)先過濾掉不必要的數(shù)據(jù)，盡量控制在一個較小的數(shù)據(jù)區(qū)來查詢數(shù)據(jù)。一個很重要的意見是：盡量在where條件中帶入分區(qū)列查詢，如果沒有mysql就會掃描所有分區(qū)，我們可以使用expain patitions 來查看sql語句是否使用了分區(qū)過濾，如：

explain partitions select * from tuser

結(jié)果顯示掃描的所有分區(qū)，我們再加上where條件：

explain partitions SELECT * from tuser where cid=2000

結(jié)果顯示只掃描了一個分區(qū)。

為什么要使用數(shù)據(jù)分區(qū)？

表數(shù)據(jù)非常大后使用索引的代價過大、表數(shù)據(jù)呈現(xiàn)明顯的熱點數(shù)據(jù)。
分區(qū)表的數(shù)據(jù)更容易維護(hù)，可以多帶帶的針對子表進(jìn)行優(yōu)化和修復(fù)工作，也可以操作整個分區(qū)數(shù)據(jù)。
分區(qū)子表的數(shù)據(jù)可以部署到不同的物理設(shè)備上，可以高效的利用多個硬件設(shè)備。
由于一個大表數(shù)據(jù)分散到多個子表中，這樣可以避免單個索引的互斥和鎖的競爭。

常見的問題有哪些？

一個表最多只能有1024個分區(qū)。
分區(qū)過多可能會導(dǎo)致在進(jìn)行分區(qū)重組（重組會涉及到臨時數(shù)據(jù)表的復(fù)制和刪除）、表數(shù)據(jù)更新、分區(qū)查找的時候開銷過大。
執(zhí)行命令前mysql會鎖住所有分區(qū)表，這個操作是在過濾分區(qū)和執(zhí)行sql語句之前執(zhí)行的，所以這個開銷無法避免，最好的做法是控制分區(qū)表數(shù)量在100個以內(nèi)。
分區(qū)表達(dá)式的返回值必須是整數(shù)。
分區(qū)表無法使用外鍵。
null值會使分區(qū)過濾無效。
mysql5.5以后對分區(qū)表做了大范圍的優(yōu)化和bug修復(fù)，所以使用這個特性之前確保你mysql高于5.5版本。
分區(qū)列和索引類不匹配，如果我們在某些列上創(chuàng)建了索引，但這些列又不參與分區(qū)，即 partition by 類型（列的表達(dá)式）子句不包含這些索引列，那么mysql在掃描這些索引的時候會遍歷所有分區(qū)表的索引，除非where子句使用了分區(qū)列來查詢，為了避免這個問題盡量使用索引列來分區(qū)，比如：

評論0 贊同0

加載中...

sPeng

回答于2022-06-28 14:08

數(shù)據(jù)分區(qū)是一種物理數(shù)據(jù)庫的設(shè)計技術(shù)，它的目的是為了在特定的SQL操作中減少數(shù)據(jù)讀寫的總量以縮減響應(yīng)時間。要搞清楚數(shù)據(jù)庫分區(qū)，先要清楚一下問題

為什么要分區(qū)

在實際工作中隨著業(yè)務(wù)的增長，我們的數(shù)據(jù)庫數(shù)據(jù)越來越大，隨之而來的是單個表中數(shù)據(jù)太多。以至于查詢速度變慢，而且由于表的鎖機(jī)制導(dǎo)致應(yīng)用操作也受到嚴(yán)重影響，出現(xiàn)了數(shù)據(jù)庫性能瓶頸。

也就是說當(dāng)表中的數(shù)據(jù)量不斷增大，查詢數(shù)據(jù)的速度就會變慢，應(yīng)用程序的性能就會下降，這時就應(yīng)該考慮對表進(jìn)行分區(qū)。表進(jìn)行分區(qū)后，邏輯上表仍然是一張完整的表，只是將表中的數(shù)據(jù)在物理上存放到多個表空間(物理文件上)，這樣查詢數(shù)據(jù)時，不至于每次都掃描整張表。為了提高數(shù)據(jù)庫性能，保證數(shù)據(jù)的準(zhǔn)確無誤以及安全性。所以要進(jìn)行分區(qū)。

數(shù)據(jù)庫分區(qū)的概念和原理

分區(qū)并不是生成新的數(shù)據(jù)表，而是將表的數(shù)據(jù)均衡分?jǐn)偟讲煌?/strong>硬盤，系統(tǒng)或是不同服務(wù)器存儲介子中，實際上還是一張表。

要實現(xiàn)這一功能，首先要了解數(shù)據(jù)庫對水平分區(qū)表進(jìn)行分區(qū)存儲的原理。

為了方便理解數(shù)據(jù)分區(qū)，在這里先介紹一下分表的概念。分表是將一個大表按照一定的規(guī)則分解成多張具有獨立存儲空間的實體表，每個表都對應(yīng)三個文件，MYD數(shù)據(jù)文件，.MYI索引文件，.frm表結(jié)構(gòu)文件。這些表可以分布在同一塊磁盤上，也可以在不同的機(jī)器上。app讀寫的時候根據(jù)事先定義好的規(guī)則得到對應(yīng)的表名，然后去操作它。

數(shù)據(jù)庫分區(qū)和分表相似，都是按照規(guī)則分解表。不同在于分表將大表分解若干個獨立的實體表，而分區(qū)是將數(shù)據(jù)分段劃分在多個位置存放，分區(qū)后，表還是一張表，但數(shù)據(jù)散列到多個位置了。應(yīng)用程序讀寫的時候操作還是表名，DB自動去組織分區(qū)的數(shù)據(jù)。

所謂水平分區(qū)分表，就是把邏輯上的一個表，在物理上按照你指定的規(guī)則分放到不同的文件里，把一個大的數(shù)據(jù)文件拆分為多個小文件，還可以把這些小文件放在不同的磁盤下。這樣把一個大的文件拆分成多個小文件，便于我們對數(shù)據(jù)的管理。

數(shù)據(jù)庫分區(qū)的優(yōu)勢

分區(qū)可以做到將表的數(shù)據(jù)均衡到不同的地方，提高數(shù)據(jù)檢索的效率，降低數(shù)據(jù)庫的頻繁IO壓力值，目的是為了在特定的SQL操作中減少數(shù)據(jù)讀寫的總量以縮減響應(yīng)時間。

1、相對于單個文件系統(tǒng)或是硬盤，分區(qū)可以存儲更多的數(shù)據(jù)；

2、數(shù)據(jù)管理比較方便，比如要清理或廢棄某年的數(shù)據(jù)，就可以直接刪除該日期的分區(qū)數(shù)據(jù)即可；

3、精準(zhǔn)定位分區(qū)查詢數(shù)據(jù)，不需要全表掃描查詢，大大提高數(shù)據(jù)檢索效率；

4、可跨多個分區(qū)磁盤查詢，來提高查詢的吞吐量；

5、在涉及聚合函數(shù)查詢時，可以很容易進(jìn)行數(shù)據(jù)的合并；

總結(jié)

分區(qū)確實能夠帶數(shù)據(jù)庫性能的提高，運用也是非常廣泛，但同時也有很多要注意的地方。在性能的考量上。并不是說分區(qū)越多，性能就越好。這些分區(qū)都會影響到內(nèi)存的消耗，CPU的繁忙程度。所以你在使用分區(qū)的時候，要找到你的平衡點。還是那句話不用最好的，要用最適合的。看完有幫助的話麻煩點個贊，關(guān)注一下，歡迎留言評論。

評論0 贊同0

加載中...

相關(guān)問題

0
回答

數(shù)據(jù)庫分區(qū)是什么？

vboy1010 2022-06-28 14:08 781人閱讀

0
回答

Linux安裝時，各個分區(qū)的作用是什么？

Y3G 2022-06-28 11:57 1156人閱讀

0
回答

請教：多LINUX分區(qū)擴(kuò)容？

codeGoogle 2022-06-28 11:39 647人閱讀

0
回答

2003怎么分區(qū)

陳江龍 2022-06-15 15:28 621人閱讀

0
回答

安裝2003怎么分區(qū)

付倫 2022-06-15 15:28 1033人閱讀

0
回答

主機(jī)怎么增加硬盤分區(qū)

趙春朋 2022-06-15 15:28 701人閱讀

0
回答

如何查看linux分區(qū)

陳江龍 2022-06-15 15:27 581人閱讀

0
回答

如何看linux的分區(qū)

陳偉 2022-06-15 15:27 878人閱讀

0
回答

LINUX如何設(shè)置開機(jī)自動掛載分區(qū)？

sutaking 2022-06-28 12:04 1023人閱讀

0
回答

linux分區(qū)滿了，如何進(jìn)行擴(kuò)容？

wing324 2022-06-28 11:39 1971人閱讀

云數(shù)據(jù)庫MySQL linux分區(qū)格式是 linux硬盤分區(qū)的命令是最佳適應(yīng)算法的空閑分區(qū)是什么是數(shù)據(jù)
這樣搜索試試？去問U認(rèn)證專家

vboy1010

男|

我要關(guān)注我要私信

TA的文章
閱讀更多

最新活動

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

問答專欄Q & A COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

數(shù)據(jù)庫分區(qū)是什么？

寫回答

3條回答

huashiou

回答于2022-06-28 14:08

SmallBoyO

回答于2022-06-28 14:08

什么是分區(qū)？

分區(qū)的原理？

分區(qū)類型有哪些？

分區(qū)查詢優(yōu)化？

為什么要使用數(shù)據(jù)分區(qū)？

常見的問題有哪些？

sPeng

回答于2022-06-28 14:08

為什么要分區(qū)

數(shù)據(jù)庫分區(qū)的概念和原理

數(shù)據(jù)庫分區(qū)的優(yōu)勢

總結(jié)

相關(guān)問題