{eval=Array;=+count(Array);}

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

問答專欄Q & A COLUMN

mysql數(shù)據(jù)表規(guī)模九千萬左右,怎么優(yōu)化查詢?

olleolle 回答0 收藏1
收藏問題

10條回答

elisa.yang

elisa.yang

回答于2022-06-28 14:38

我的天啦,一個表九千萬也是了不得了!

我上家公司明確規(guī)定,一張表不能超過5000萬,因為查詢效率會有更大的降低!

無論如何,看下如何優(yōu)化數(shù)據(jù)查詢吧!

①,單庫單表:

1,加索引,一個好的索引能用空間換取查詢時間的大為降低!

2,使用存儲過程:減少sql編譯的時間!

3,優(yōu)化sql:包括聯(lián)合查詢的指向,where,order語句使用索引字段,減少使用多表聯(lián)合查詢,不要使用select *等等!

4,參數(shù)配置:擴大內(nèi)存,調(diào)節(jié)線程池參數(shù)等等!

5,開啟緩存:開啟二級緩存,三級緩存,提升查詢效率!

②,單庫多表:

使用水平拆分(比如按月份),將表分為12張表,然后在代碼端按照月份訪問相應(yīng)月份的表!

使用垂直拆分:很多字段只是作為保存記錄用,(像一些約定,備注啥的字段往往很大),可以將查詢中常常用到的字段放在常用的一張表中做查詢,另一些字段放另一張表中存儲,通過某個唯一索引字段聯(lián)系起來,可以保證查詢效率大為提升(因為磁盤IO減少)!

③,多庫多表:

①,主從讀寫分離:表中數(shù)據(jù)雖然還是一致,但是由于多個從庫讀,主庫寫數(shù)據(jù),大大減少共享鎖的性能開銷!

②,分庫分表:指定一個字段作為,分庫字段,利用hash值或者其它策略,分布在不同的庫里面,在按照相應(yīng)分布策略(比如上面的水平拆分或者垂直拆分),分散到不同的表里!

比如我們現(xiàn)在的數(shù)據(jù)庫設(shè)計為8庫1024表,你的將近一億的數(shù)據(jù)在我們的單張表里面只有不到10W!

雖然理論上,一張表的大小不做任何限制,但是基于查詢效率,索引性能等,不宜超出5000萬數(shù)據(jù)!

關(guān)于多線程,分布式,微服務(wù),數(shù)據(jù)庫,緩存的更多干貨,會繼續(xù)分享,敬請關(guān)注。。

評論0 贊同0
  •  加載中...
HollisChuang

HollisChuang

回答于2022-06-28 14:38

實踐出真知。根據(jù)成本順序依次是:

第一:加索引優(yōu)化sql。盡量避免全盤掃描,另單表索引也不是越多越好。

第二:加緩存。使用redis,memcached,但注意緩存同步更新、設(shè)置失效等問題。

第三:主從復(fù)制,讀寫分離。適合讀多寫少的場景,同步會有延遲。

第四:垂直拆分。可以選用適當?shù)闹虚g件Mycat等

第五:水平切分。選擇合理的sharding key,改動表結(jié)構(gòu),將大數(shù)據(jù)字段拆分出去,對經(jīng)常查詢的字段做一定的冗余,同時做好數(shù)據(jù)同步。

當然還有優(yōu)化數(shù)據(jù)庫連接配置,根據(jù)業(yè)務(wù)選用不同的數(shù)據(jù)庫引擎等等。

我是一名架構(gòu)師,歡迎關(guān)注,給技術(shù)加點料

評論0 贊同0
  •  加載中...
孫淑建

孫淑建

回答于2022-06-28 14:38

我不清楚答題的大部分人是否有真正實踐過,特別是用mysql實踐過。大部分說是加索引、調(diào)整參數(shù)不是說不正確,有效果,但是不能很好的解決問題。說說個人想法:


部分答主的方案的確不敢茍同,糾正如下:

1、select count(*) 和 select count(主鍵) 在現(xiàn)階段的mysql 沒有太大區(qū)別,新版mysql這個對性能影響可以忽略。

2、強烈反對使用存儲過程,后面介紹了使用分表分庫的方案,就更不要用存儲過程了。

3、單表行數(shù)和表數(shù)量,需要找到平衡點。表太多,性能也會下降。


我的回答:

1、單表9000w數(shù)據(jù),mysql存儲不了,想辦法分表分庫。500w數(shù)據(jù)的時候,你就該有這個想法了。只加索引解決不了問題,9000w的單表數(shù)據(jù),很難平衡查找和插入性能,索引稍微多了插入性能也很低。

2、不要再說select count了,放棄匯總查詢的想法,根本查不了。

3、數(shù)據(jù)最終以mysql作為主要存儲,考慮最終查詢的數(shù)據(jù)源放在非關(guān)系的數(shù)據(jù)存儲上,mongo,es都可以考慮下。

4、業(yè)務(wù)場景都是需要實時查詢9000w數(shù)據(jù)嗎?非實時數(shù)據(jù),可以考慮hadoop系大數(shù)據(jù)方案。

5、最后說下,mysql 和oracle,sql server不一樣,不一樣。

評論0 贊同0
  •  加載中...
Bryan

Bryan

回答于2022-06-28 14:38

是一張表九千萬了嗎?

建議:

第一、表讀居多還是寫?讀的話數(shù)據(jù)庫引擎用myisam ,寫的話InnoDB 而不是MyISAM,因為MyISAM有太多鎖。

第二、升級到MySQL 5.5 ,確保使用buffering功能。

第三,索引確保使用正確,且都在內(nèi)存中,移除沒有必要的索引。

第四、寫場景多嗎? 設(shè)置innodb_buffer_pool_size足夠大來確保更快的寫操作。

第五、按業(yè)務(wù)id取模,分表。

最后,花錢加機器內(nèi)存和用ssd磁盤吧。

評論0 贊同0
  •  加載中...
AJie

AJie

回答于2022-06-28 14:38

作為一個多年的WEB后端程序員,經(jīng)常與各種數(shù)據(jù)庫打交道,下面分享一些自己的處理方式給你。

對于數(shù)據(jù)量這么大的數(shù)據(jù),MySQL提供了以下優(yōu)化方案:

1.常規(guī)方式索引,這里需要注意的是,索引也是一種文件,如果你的服務(wù)器或者數(shù)據(jù)庫內(nèi)存非常小,一次無法將所有的索引文件載入,這個時候索引文件因為要反復(fù)在磁盤和內(nèi)存之間進行切換,這樣效果肯定非常不明顯,導(dǎo)致查詢也變慢,所以這種情況可以適當增加內(nèi)存,以滿足索引文件一次載入到內(nèi)存進行檢索查詢。

2.表分區(qū)保存,對于這么大的數(shù)據(jù),可以根據(jù)具體的需求進行表分區(qū)保存,在進行表分區(qū)保存的時候,需要注意,一定要根據(jù)具體的需求進行分區(qū),這和建立索引是一樣的道理。

3.用程序?qū)崿F(xiàn)分表保存,比如在保存和查詢數(shù)據(jù)的時候,生成主鍵時,可以用某種規(guī)則將其保存在90個表左右,這樣就變成了90個100萬數(shù)據(jù)的表,查詢肯定會提升,不過對于分表保存,目前MySQL數(shù)據(jù)庫對于INNODB存儲引擎沒有提供太多的支持,所以這一切必須由我們自己寫程序來實現(xiàn)。

如果你還有什么問題,可以在評論中留言。

評論0 贊同0
  •  加載中...
Richard_Gao

Richard_Gao

回答于2022-06-28 14:38

讀寫分離,分庫分表,熱數(shù)據(jù)放內(nèi)存。

讀寫分離:減少寫庫所帶來的行鎖甚至表鎖對查詢的影響,提升查詢效率,同時還可以保證高可用。

在設(shè)計系統(tǒng)之初就設(shè)計好垂直分庫和垂直分表,比如垂直分表:在一張大表中,一些熱數(shù)據(jù)的字段放在一起,一些不常用的而且占用空間比較大的字段放在另外一張表,這樣子做的好處是提升了查詢速度,因為mysql是以頁存儲數(shù)據(jù)的,一頁之中存放的數(shù)據(jù)越多,查詢效率會更高。

另外再配合redis mongodb這些緩存數(shù)據(jù)庫,熱數(shù)據(jù)放進去,查詢效率會進一步得到提升。

如果上面的方案還無法解決查詢緩慢的問題,可能是因為我們的數(shù)據(jù)量非常大,而且持續(xù)快速增長。我們還可以進行水平分庫分表,例如把一張1億數(shù)據(jù)量的大表,水平拆分成10張相同的大表,再水平拆分到10個不同的數(shù)據(jù)庫中。。。

覺得可以的點個贊

評論0 贊同0
  •  加載中...
RyanQ

RyanQ

回答于2022-06-28 14:38

9千萬的數(shù)據(jù),如果現(xiàn)在基本不再增長,可以優(yōu)化一下,首先找到性能問題的原因,是sql的問題,還是設(shè)計的問題。為了提高查詢效率,在設(shè)計上可以采用非常規(guī)設(shè)計,比如反范式設(shè)計等?;蛘甙裫oin的表拆開。方法很多,只能根據(jù)具體業(yè)務(wù)來說,你可以把現(xiàn)在的查詢語句列出來,具體分析。9千萬數(shù)據(jù),如果根據(jù)主鍵id查詢,那也能在100ms內(nèi)查詢出來結(jié)果。


如果現(xiàn)在每天還有不少增量數(shù)據(jù),分表就不可避免了。就是把一個表的數(shù)據(jù)分成多個表,這個還是得 根據(jù)業(yè)務(wù)類型來確定,按照時間來分表?還是按照id來分?這個得具體分析。分庫分表帶來的 改動相對較大。

評論0 贊同0
  •  加載中...
jonh_felix

jonh_felix

回答于2022-06-28 14:38

最簡單的方法就是優(yōu)化查詢,第一點,可以建立索引,因為索引可以很大程度優(yōu)化查詢。第二點,可以配置緩存還可以用slow_query_log進行分析,這樣很大提升查詢的。第三點,建立分庫分表,因為分庫分表是查詢的殺手锏。第四點,優(yōu)化sql語句,比如子查詢的優(yōu)化等。第五點,就是在連表查詢是要使用Join表的時候使用相當類型的例,并將其為索引。

評論0 贊同0
  •  加載中...
Shihira

Shihira

回答于2022-06-28 14:38

9000萬的話,如果前端訪問量不是過大,單機就可以優(yōu)化


數(shù)據(jù)庫優(yōu)化

  • 結(jié)合slow query,用explain進行sql優(yōu)化,包括優(yōu)化索引等優(yōu)化。只有最慢的幾條sql優(yōu)化好了,瞬間整個mysql都暢快了
  • 分表,根據(jù)一定的條件進行分表,比如按照時間或者冷熱數(shù)據(jù)或者hash區(qū)分
  • 不能分表,就加點內(nèi)存,調(diào)一下mysql的緩存參數(shù)
  • 讀寫分離,以這個數(shù)據(jù)量場景如果數(shù)據(jù)量增長不大,前端訪問不頻繁,就沒必要讀寫分離,做分表就ok

應(yīng)用層優(yōu)化

  • 原則就是優(yōu)化slow query排前的,還有就是量大排前的,通過應(yīng)用層代碼替代數(shù)據(jù)訪問減少對數(shù)據(jù)庫的壓力和訪問量
  • 增加緩存,比如程序自身開設(shè)緩存或者redis等專門緩存服務(wù)器
  • 優(yōu)化sql,尤其是關(guān)聯(lián)查詢,都要避免掉,改成n+1查詢,讓n都能命中緩存
  • 高頻sql盡量優(yōu)化成可以走緩存
  • 針對分表要做dao層改進
  • 如果數(shù)據(jù)庫讀寫分離,這邊也需要修改

評論0 贊同0
  •  加載中...
glumes

glumes

回答于2022-06-28 14:38

首先應(yīng)該看你們是什么業(yè)務(wù),針對業(yè)務(wù)類型的不同可以采取不同的優(yōu)化方式。

1.如果是線上環(huán)境,對外提供服務(wù),這個表確實是很大了,無論索引設(shè)計的多么合理,進行查詢和插入的時候都會耗時較長,性能低下。特別是遇到連表查詢的時候,會更慢。這個時候可以考慮進行分表或者分區(qū)表。

1.1分表:是將一個大表按照一定的規(guī)則分解成多張具有獨立存儲空間的實體表,我們可以稱為子表。app讀寫的時候需要先根據(jù)事先定義好的規(guī)則得到對應(yīng)的子表名。

1.2分區(qū)表:和分表相似,都是按照規(guī)則分解表。不同在于分表將大表分解為若干個獨立的實體表,而分區(qū)是將數(shù)據(jù)分段劃分在多個位置存放,可以是同一塊磁盤也可以在不同的機器。分區(qū)后,表面上還是一張表,但數(shù)據(jù)散列到多個位置了。app讀寫的時候操作的還是大表名字,這種方式對程序來說是透明的,無需更改程序。不過要注意sql查詢的時候需要加上可以定位到某個分區(qū)表的條件,否則會是整個大表掃描,性能比未分區(qū)前更慢。

分區(qū)的類型有:

RANGE分區(qū):基于屬于一個給定連續(xù)區(qū)間的列值,把多行分配給分區(qū)。

LIST分區(qū):類似于按RANGE分區(qū),區(qū)別在于LIST分區(qū)是基于列值匹配一個離散值集合中的某個值來進行選擇。

HASH分區(qū):基于用戶定義的表達式的返回值來進行選擇的分區(qū),該表達式使用將要插入到表中的這些行的列值進行計算。這個函數(shù)可以包含MySQL 中有效的、產(chǎn)生非負整數(shù)值的任何表達式。

KEY分區(qū):類似于按HASH分區(qū),區(qū)別在于KEY分區(qū)只支持計算一列或多列,且MySQL服務(wù)器提供其自身的哈希函數(shù)。必須有一列或多列包含整數(shù)值。

除了分表和分區(qū)表外,還可以采取緩存,redis或者mamecache,降低mysql數(shù)據(jù)庫的壓力。

2.如果是統(tǒng)計業(yè)務(wù),則可以采取別的數(shù)據(jù)庫存儲數(shù)據(jù),像是列數(shù)據(jù)庫,mariadb columnstore ,計算能力比myslq強大很多。

評論0 贊同0
  •  加載中...

最新活動

您已邀請0人回答 查看邀請

我的邀請列表

  • 擅長該話題
  • 回答過該話題
  • 我關(guān)注的人
向幫助了您的網(wǎng)友說句感謝的話吧!
付費偷看金額在0.1-10元之間
<