支撐日活百萬用戶的高并發(fā)系統(tǒng)，應(yīng)該如何設(shè)計(jì)其數(shù)據(jù)庫架構(gòu)？？

Vultr 2022-06-28 14:22 回答0 收藏1

收藏問題

6條回答

guqiu

回答于2022-06-28 14:22

以mysql為列：

1：支撐高并發(fā)系統(tǒng)，一定會(huì)涉及事務(wù)，所以數(shù)據(jù)庫引擎必選innodb，innodb支持事務(wù)，事務(wù)級(jí)別根據(jù)業(yè)務(wù)而定，如果業(yè)務(wù)數(shù)據(jù)一致性要求很高，事務(wù)就開啟序列化級(jí)別，這樣就完全隔離事務(wù)，但是會(huì)導(dǎo)致鎖資源競爭加劇。mysql的性能有一定的降低。

2：讀寫分離，數(shù)據(jù)庫分成主庫和從庫，主庫負(fù)責(zé)寫數(shù)據(jù)，叢庫負(fù)責(zé)讀數(shù)據(jù)。注意主從數(shù)據(jù)庫數(shù)據(jù)一致性問題。

3：冷熱數(shù)據(jù)分離，美團(tuán)，餓了么部分設(shè)計(jì)采用冷熱數(shù)據(jù)分離，拿訂單來說，已送達(dá)訂單，主要的業(yè)務(wù)場景就是查詢，越往前的數(shù)據(jù)查詢的概率就越低。這就是冷數(shù)據(jù)。正在交易的訂單就是熱數(shù)據(jù)，需要時(shí)時(shí)查詢和更新。對(duì)于冷數(shù)據(jù)，可以放到redis緩存。這樣會(huì)增加查詢效率。

4：數(shù)據(jù)表設(shè)計(jì)，充分利用索引查詢。業(yè)務(wù)sql避免返回?zé)o用的行和列，禁止使用select *查詢，查詢的時(shí)候加limit，盡可能返回滿足要求的行。對(duì)于復(fù)雜的sql，考慮拆分sql，拆分sql有一個(gè)好處，重復(fù)查詢的sql，第二次查詢會(huì)放到mysql的緩沖區(qū)，避免重復(fù)操作磁盤，提高訪問的性能。

5：分庫分表。比如業(yè)務(wù)數(shù)據(jù)按月分等。一定程度緩解增刪改查的壓力。

希望對(duì)你有一定的幫助。謝謝。

評(píng)論0 贊同0

加載中...

jeffrey_up

回答于2022-06-28 14:22

之前做過一個(gè)每天訪問量達(dá)到800w的系統(tǒng)，簡單說下自己的見解！

從整個(gè)應(yīng)用系統(tǒng)來看，想要支持超高并發(fā)量，負(fù)載均衡，緩存，消息中間件，數(shù)據(jù)庫讀寫分離，分庫分表等必不可少，既然文章只問了數(shù)據(jù)庫系統(tǒng)，那就只談數(shù)據(jù)庫！

數(shù)據(jù)庫層面，一般無外乎是主從復(fù)制，讀寫分離，分庫分表這些東西！

1，從單臺(tái)數(shù)據(jù)庫性能來看，單個(gè)mysql實(shí)例最大連接數(shù)為16384，就是說在同一時(shí)間最多能容納那么多的訪問量，同時(shí)受服務(wù)器CPU，內(nèi)存，硬盤等的影響，但是在實(shí)際應(yīng)用中能達(dá)到2000就不錯(cuò)了！

需要使用druid等數(shù)據(jù)庫監(jiān)控中間件，實(shí)時(shí)的監(jiān)控?cái)?shù)據(jù)庫連接，sql效率等各種指標(biāo)，在達(dá)到瓶頸之前找到辦法，show status;這個(gè)指令也可以方便的查看數(shù)據(jù)庫實(shí)例的各項(xiàng)指標(biāo)

單臺(tái)數(shù)據(jù)庫實(shí)例配置最優(yōu)化是保證整個(gè)數(shù)據(jù)庫集群最優(yōu)化的基本保證！

2，數(shù)據(jù)庫集群:以分庫分表為例，分庫分表的方式有很多，比如mycat，Sharding-jdbc等。

分庫分表的思想很簡單，比如單表1億的數(shù)據(jù)量，查詢效率很低，如果使用8庫1024表拆分，每張表中的數(shù)據(jù)不會(huì)超過10萬，對(duì)數(shù)據(jù)庫來說不存在任何瓶頸，就算總數(shù)據(jù)量達(dá)到100億，單表的查詢也不會(huì)慢！

拆分的策略通常以某個(gè)全局唯一的業(yè)務(wù)主鍵使用某種方式(比如hash取模，按月份等等)進(jìn)行分庫分表的計(jì)算！

那么問題來了，全局唯一的字段怎么獲取？普通的數(shù)據(jù)庫主鍵自增，uuid等不再合適，可以使用redis，zookeeper等獲取全局唯一的id，具體可參見之前的其他回答！

問題:分庫分表之后存在跨庫join的問題，通常的解決方式為1，盡量使用分庫分表主鍵能保證在同一庫，同一類型的表中進(jìn)行連接查詢，2，增加專門的查詢庫:將常用的數(shù)據(jù)字段冗余到查詢庫中，方便連接查詢和常用字段的快速查詢；

4，sql優(yōu)化：最基本的條件查詢，count，分組等使用索引字段等避免全局查詢，避免null值判斷，避免使用not in，避免無效的like語句，避免查詢的時(shí)候使用函數(shù)操作等等！

5，像秒殺系統(tǒng)等這種瞬時(shí)高并發(fā)，最好借助緩存系統(tǒng)來完成！

總而言之，數(shù)據(jù)庫是整個(gè)應(yīng)用系統(tǒng)當(dāng)中最核心，也是最容易出問題的地方，做好監(jiān)控，提前預(yù)防才能保證系統(tǒng)訪問量的增長！

評(píng)論0 贊同0

加載中...

Thanatos

回答于2022-06-28 14:22

這個(gè)問題的需求不夠明確，主要是業(yè)務(wù)方面。

比如是一個(gè)百萬日活的IM系統(tǒng)。

則百萬日活的，假定有1000萬用戶的系統(tǒng)，用MYSQL基本可以不用分庫分表（可以采用讀寫分離）。

主要是緩存系統(tǒng)的設(shè)計(jì)，常見的比如redis，可以用戶全緩存在redis中，只有用戶更改時(shí)才回寫（回寫也可以先寫緩存，再異步刷入庫中）。這樣的設(shè)計(jì)，就用戶表而言，基本是沒有多少負(fù)載的。

真正復(fù)雜的是業(yè)務(wù)本身，比如是一個(gè)論壇，可能一天的新貼，回復(fù)等會(huì)產(chǎn)生巨量的數(shù)據(jù)?；蚴且粋€(gè)電商系統(tǒng)，商品，訂單等。這些沒有數(shù)據(jù)量都無法評(píng)估。

只是總體來看，用MYSQL（讀寫分離，分表設(shè)計(jì)）+緩存是夠用了。

評(píng)論0 贊同0

加載中...

zzzmh

回答于2022-06-28 14:22

日活都百萬了，那么我估算一下場景

數(shù)據(jù)存量較大，一般來講這個(gè)總用戶量至少千萬級(jí)別
數(shù)據(jù)增量不少（包括業(yè)務(wù)數(shù)據(jù)和日志數(shù)據(jù)）
訪問壓力也有一定量
對(duì)于數(shù)據(jù)挖掘和分析應(yīng)該有很大需求，需要滿足精細(xì)化運(yùn)營需求
性能、吞吐等都有一定要求

建議使用TiDB即可

TiDB 是 PingCAP 公司自主設(shè)計(jì)、研發(fā)的開源分布式關(guān)系型數(shù)據(jù)庫，是一款同時(shí)支持在線事務(wù)處理與在線分析處理 (Hybrid Transactional and Analytical Processing, HTAP）的融合型分布式數(shù)據(jù)庫產(chǎn)品，具備水平擴(kuò)容或者縮容、金融級(jí)高可用、實(shí)時(shí) HTAP、云原生的分布式數(shù)據(jù)庫、兼容 MySQL 5.7 協(xié)議和 MySQL 生態(tài)等重要特性。目標(biāo)是為用戶提供一站式 OLTP (Online Transactional Processing)、OLAP (Online Analytical Processing)、HTAP 解決方案。TiDB 適合高可用、強(qiáng)一致要求較高、數(shù)據(jù)規(guī)模較大等各種應(yīng)用場景。

五大核心特性：

一鍵水平擴(kuò)容或者縮容得益于 TiDB 存儲(chǔ)計(jì)算分離的架構(gòu)的設(shè)計(jì)，可按需對(duì)計(jì)算、存儲(chǔ)分別進(jìn)行在線擴(kuò)容或者縮容，擴(kuò)容或者縮容過程中對(duì)應(yīng)用、運(yùn)維人員透明。
金融級(jí)高可用數(shù)據(jù)采用多副本存儲(chǔ)，數(shù)據(jù)副本通過 Multi-Raft 協(xié)議同步事務(wù)日志，多數(shù)派寫入成功事務(wù)才能提交，確保數(shù)據(jù)強(qiáng)一致性且少數(shù)副本發(fā)生故障時(shí)不影響數(shù)據(jù)的可用性?？砂葱枧渲酶北镜乩砦恢?、副本數(shù)量等策略滿足不同容災(zāi)級(jí)別的要求。
實(shí)時(shí) HTAP提供行存儲(chǔ)引擎 TiKV、列存儲(chǔ)引擎 TiFlash 兩款存儲(chǔ)引擎，TiFlash 通過 Multi-Raft Learner 協(xié)議實(shí)時(shí)從 TiKV 復(fù)制數(shù)據(jù)，確保行存儲(chǔ)引擎 TiKV 和列存儲(chǔ)引擎 TiFlash 之間的數(shù)據(jù)強(qiáng)一致。TiKV、TiFlash 可按需部署在不同的機(jī)器，解決 HTAP 資源隔離的問題。
云原生的分布式數(shù)據(jù)庫專為云而設(shè)計(jì)的分布式數(shù)據(jù)庫，通過 TiDB Operator 可在公有云、私有云、混合云中實(shí)現(xiàn)部署工具化、自動(dòng)化。
兼容 MySQL 5.7 協(xié)議和 MySQL 生態(tài)兼容 MySQL 5.7 協(xié)議、MySQL 常用的功能、MySQL 生態(tài)，應(yīng)用無需或者修改少量代碼即可從 MySQL 遷移到 TiDB。提供豐富的數(shù)據(jù)遷移工具幫助應(yīng)用便捷完成數(shù)據(jù)遷移。

評(píng)論0 贊同0

加載中...

call_me_R

回答于2022-06-28 14:22

那活百萬就算全部集中在高峰期十個(gè)小時(shí)。小時(shí)也就10萬。

就算每秒有10萬的點(diǎn)擊。

備兩臺(tái)緩存的機(jī)器應(yīng)該就足夠了。

評(píng)論0 贊同0

加載中...

EddieChan

回答于2022-06-28 14:22

百萬不需要設(shè)計(jì)。

評(píng)論0 贊同0

加載中...

Vultr

男|

我要關(guān)注我要私信

TA的文章

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

問答專欄Q & A COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

支撐日活百萬用戶的高并發(fā)系統(tǒng)，應(yīng)該如何設(shè)計(jì)其數(shù)據(jù)庫架構(gòu)？？

寫回答

6條回答

guqiu

回答于2022-06-28 14:22

jeffrey_up

回答于2022-06-28 14:22

Thanatos

回答于2022-06-28 14:22

zzzmh

回答于2022-06-28 14:22

call_me_R

回答于2022-06-28 14:22

EddieChan

回答于2022-06-28 14:22

相關(guān)問題