摘要:我們非常希望本屆誕生的優(yōu)秀項目能夠在社區(qū)中延續(xù)下去,感興趣的小伙伴們可以加入進(jìn)來哦本文作者是來自團隊的楊文同學(xué),他們的項目天真貝葉斯學(xué)習(xí)機在本屆中獲得了三等獎最佳創(chuàng)意獎。比賽前一日從廣州南站出發(fā),次日抵達(dá)北京西站。
Ti Hack 系列
TiDB Hackathon 2018 共評選出六組優(yōu)秀項目,本系列文章將由這六組項目的成員主筆,分享他們的參賽經(jīng)驗和成果。我們非常希望本屆 Hackathon 誕生的優(yōu)秀項目能夠在社區(qū)中延續(xù)下去,感興趣的小伙伴們可以加入進(jìn)來哦~本文作者是來自 DSG 團隊的楊文同學(xué),他們的項目《天真貝葉斯學(xué)習(xí)機》在本屆 Hackathon 中獲得了三等獎+最佳創(chuàng)意獎。
“在 TiDB Hackathon 2018 學(xué)習(xí)到不少東西,希望明年再來”
簡述“pd ctl 天真學(xué)習(xí)機”
具體做法:用 naive bayes 模型來根據(jù)系統(tǒng)指標(biāo)和人的 pd ctl 調(diào)用,來得到一個模型去根據(jù)系統(tǒng)指標(biāo)去自動提供 pd ctl 調(diào)用的命令。
1.貝葉斯算法舉例貝葉斯模型可以用來干這種事:
比如一個媽媽根據(jù)天氣預(yù)報來跟兒子在出們的時候叮囑:
天氣預(yù)報[ 晴, 溫度: 28, 風(fēng)力: 中 ], 媽媽會說 [好好玩] 天氣預(yù)報[ 雨, 溫度: 15, 風(fēng)力: 低 ], 媽媽會說 [帶上傘] 天氣預(yù)報[ 陰, 溫度: 02, 風(fēng)力: 大 ], 媽媽會說 [多穿點]...
把這些輸入輸入到貝葉斯模型里以后, 模型可以根據(jù)天氣預(yù)報來輸出:
天氣預(yù)報[ 晴, 溫度: 00, 風(fēng)力中], 模型會說 [ 多穿點:0.7, 好好玩0.2, 帶上傘0.1] 天氣預(yù)報[ 雨, 溫度: 10, 風(fēng)力大], 模型會說 [ 帶上傘:0.8, 多穿點0.1, 好好玩0.1]
這樣通過一個媽媽的叮囑就可以訓(xùn)練出一個也會根據(jù)天氣預(yù)報給出叮囑的模型。
2. 初步想法我們可以把一個模型多帶帶的部署在一個 pod 里, 暴露一個 service ,然后集群上每次有人去調(diào)用 pd_ctl 的時候就在后臺用 rest call 到模型服務(wù)上記錄一下操作(叮囑)和當(dāng)前的系統(tǒng)指標(biāo)(好比天氣預(yù)報). 這樣慢慢用一段時間以后,積累的操作多了以后,就可以打開某個自動響應(yīng),或者打開自動建議應(yīng)該執(zhí)行的命令的功能。
這樣模型可以在某一組系統(tǒng)指標(biāo)出現(xiàn)之前類似學(xué)習(xí)過的狀態(tài)之后,給出相應(yīng)的建議,當(dāng)這些建議都很正確的時候直接讓 pd 直接采納,完全智能的自動化運作。
3. 實際 Hackathon 方案在跟導(dǎo)師交流探討后發(fā)現(xiàn),目前 PD 已經(jīng)比較自動化了,很少需要人為介入進(jìn)行操作,需要的時候也是比較復(fù)雜的場景,或者自動化運作比較慢的場景。
我們團隊在跟多名導(dǎo)師的溝通交流下,將初步想法進(jìn)行了一些調(diào)整:
從熱點調(diào)度策略入手,用熱點調(diào)度策略的數(shù)值去用 naive bayes 模型去訓(xùn)練他們,然后再根據(jù)這些數(shù)值再去模型中去獲取建議值。
統(tǒng)計建議值和熱點調(diào)度策略進(jìn)行比較;(從開始的測試結(jié)果來看,大概有 70% 匹配,但是我們實測發(fā)現(xiàn),使用我們模型的建議值去真正的調(diào)度,熱點 region 還是非常均衡的)
三組對照試驗:不進(jìn)行調(diào)度,只打印調(diào)度數(shù)據(jù);正常使用原來的熱點調(diào)度策略;使用原來的熱點調(diào)度策略的數(shù)值,但是使用模型訓(xùn)練的建議值進(jìn)行實際調(diào)度;
Hackathon 回顧首先,介紹一下我們團隊(DSG),分別來自:丹麥、北京(山西)、廣州。
D 先生是在比賽前一天早上到達(dá)北京的,我是比賽前一天晚上從廣州出發(fā),于比賽當(dāng)日早上 6:38 才抵達(dá)北京的。
說實話,時差和疲憊對于參賽還是有一點影響的。
廢話不多說,我就來回顧一下我的整個參賽過程。
比賽前一日 20:05 從廣州南站出發(fā),次日 6:38 抵達(dá)北京西站。
7:58 抵達(dá)地鐵西小口
8:06 經(jīng)過轉(zhuǎn)轉(zhuǎn)
8:12 抵達(dá)比賽所在地:東升科技園 C-1 樓
8:16 簽到,逛 PingCAP
8:40 跟 D 先生匯合,了解貝葉斯模型
9:20 DSG 團隊成員全部集結(jié)完畢
10:00 比賽正式開始
10:00 Hacking Time: Trello 構(gòu)建整個比賽分工、準(zhǔn)備工作、需求分析
搭建 TiDB 集群(2套)【熟悉 TiDB 集群,實操 PD-CTL】
12:17 午餐
13:00 Hacking Time: 熟悉 PD Command,貝葉斯模型,導(dǎo)師指導(dǎo),本地 TiDB 環(huán)境構(gòu)建(坑),分析 PD 熱點調(diào)度,剖析調(diào)度流程,模擬熱點數(shù)據(jù)
18:20 外出用餐(蘆月軒羊蝎子(西三旗店))【沾 D 先生的光,蹭吃蹭喝】
20:40 回到東升科技園
20:50 ~ 次日 1:10 Hacking Time: 模擬熱點數(shù)據(jù),實測調(diào)度上報和獲取模型返回結(jié)果,本地測通調(diào)度參數(shù)上報和得到模型返回值
次日 1:10 ~ 5:50 會議室休息(在此期間,我的隊友 D 先生,調(diào)好了模型,并將此模型通過 Docker 構(gòu)建部署到 PD 機器上)
次日 5:50 Hacking Time: 部署修改過的 PD 服務(wù)到線上服務(wù)器,并打通 rust-nb-server,實時上報和實時獲取模型返回結(jié)果
次日 7:30 早餐
次日 8:00 正式調(diào)試
次日 9:00 抽簽確定 Demo 時間
次日 9:00 ~ 12:00 Hacking Time: 調(diào)優(yōu)
次日 12:00 ~ 12:30 午餐時間
次日 13:00 ~ 14:00 Hacking Time: PPT,調(diào)優(yōu)
次日 14:30 ~ 18:30 Demo Time(B 站直播)
次日 18:30 ~ 19:00 頒獎(B 站直播)
完全參考文檔
測試 TiDB 集群,可能遇到的坑(MySQL 8 client On MacOSX):
mysql client connect : Unknown charset 255 (MySQL 8 Client 不支持字符集,需要指定默認(rèn)字符集為 UTF8)
mysql -hx.x.x.x --default-character-set utf8
2. 天真貝葉斯的服務(wù)接口/model/service1?PUT 上報數(shù)據(jù):
{ "updates": [ [ "transfer leader from store 7 to store 2", [ { "feature_type": "Category", "name": "hotRegionsCount1", "value": "true" }, { "feature_type": "Category", "name": "minRegionsCount1", "value": "true" }, { "feature_type": "Category", "name": "hotRegionsCount2", "value": "true" }, { "feature_type": "Category", "name": "minRegionsCount2", "value": "true" }, { "feature_type": "Category", "name": "srcRegion", "value": "7" } ] ], ]}
/model/service1 POST 獲取模型結(jié)果:
輸入?yún)?shù):上報的參數(shù)
{ "predictions": [ { "transfer leader from store 1 to store 2": 0.27432775221072137, "transfer leader from store 1 to store 7": 0.6209064350448428, "transfer leader from store 2 to store 1": 0.024587894827775753, "transfer leader from store 2 to store 7": 0.01862719305134528, "transfer leader from store 7 to store 1": 0.02591609468013258, "transfer leader from store 7 to store 2": 0.03563463018518229 } ]}3. PD 集群部署
首先將 pd-server 替換到集群所在 ansible/resources/bin 目錄下,那如何讓集群上的 PD 更新生效呢?
更新:
$ ansible-playbook rolling_update.yml --tags=pd
在實操過程中, 如果你在更新到一半的時候就關(guān)門了,可能會導(dǎo)致整個 PD 掛掉(非集群環(huán)境),可能是因為邏輯不嚴(yán)謹(jǐn)所導(dǎo)致的問題
直接停止了 ansible,導(dǎo)致 PD 集群機器節(jié)點有停止的情況,這個時候你可以通過以下命令啟動它。
啟動:
$ ansible-playbook start.yml --tags=pd4. PD 調(diào)度 4.1 取消熱點數(shù)據(jù)調(diào)度
大家都以為可以通過配置來解決:(調(diào)度開關(guān)方法: 用 config set xxx 0 來關(guān)閉調(diào)度)
配置如下:(雖然找的地方錯誤了,但是錯打錯著,我們來到了 Demo Time:
config set leader-schedule-limit 0 config set region-schedule-limit 0 scheduler add hot-region-scheduler config show config set leader-schedule-limit 4 config set region-schedule-limit 8
實測發(fā)現(xiàn),根本不生效,必須要改源代碼。
func (h *balanceHotRegionsScheduler) dispatch(typ BalanceType, cluster schedule.Cluster) []*schedule.Operator { h.Lock() defer h.Unlock() switch typ { case hotReadRegionBalance: h.stats.readStatAsLeader = h.calcScore(cluster.RegionReadStats(), cluster, core.LeaderKind) // return h.balanceHotReadRegions(cluster) // 將這一行注釋 case hotWriteRegionBalance: h.stats.writeStatAsLeader = h.calcScore(cluster.RegionWriteStats(), cluster, core.LeaderKind) h.stats.writeStatAsPeer = h.calcScore(cluster.RegionWriteStats(), cluster, core.RegionKind) // return h.balanceHotWriteRegions(cluster) // 將這一行注釋 } return nil }
但是,我們要的不是不調(diào)度,而只是不給調(diào)度結(jié)果:
func (h *balanceHotRegionsScheduler) balanceHotReadRegions(cluster schedule.Cluster) []*schedule.Operator { // balance by leader srcRegion, newLeader := h.balanceByLeader(cluster, h.stats.readStatAsLeader) if srcRegion != nil { schedulerCounter.WithLabelValues(h.GetName(), "move_leader").Inc() // step := schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // 修改為不返回值或者返回 _ _ = schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // return []*schedule.Operator{schedule.NewOperator("transferHotReadLeader", srcRegion.GetID(), srcRegion.GetRegionEpoch(), schedule.OpHotRegion|schedule.OpLeader, step)} // 注釋這一行,并 return nil return nil } // balance by peer srcRegion, srcPeer, destPeer := h.balanceByPeer(cluster, h.stats.readStatAsLeader) if srcRegion != nil { schedulerCounter.WithLabelValues(h.GetName(), "move_peer").Inc() return []*schedule.Operator{schedule.CreateMovePeerOperator("moveHotReadRegion", cluster, srcRegion, schedule.OpHotRegion, srcPeer.GetStoreId(), destPeer.GetStoreId(), destPeer.GetId())} } schedulerCounter.WithLabelValues(h.GetName(), "skip").Inc() return nil } ...... func (h *balanceHotRegionsScheduler) balanceHotWriteRegions(cluster schedule.Cluster) []*schedule.Operator { for i := 0; i < balanceHotRetryLimit; i++ { switch h.r.Int() % 2 { case 0: // balance by peer srcRegion, srcPeer, destPeer := h.balanceByPeer(cluster, h.stats.writeStatAsPeer) if srcRegion != nil { schedulerCounter.WithLabelValues(h.GetName(), "move_peer").Inc() fmt.Println(srcRegion, srcPeer, destPeer) // return []*schedule.Operator{schedule.CreateMovePeerOperator("moveHotWriteRegion", cluster, srcRegion, schedule.OpHotRegion, srcPeer.GetStoreId(), destPeer.GetStoreId(), destPeer.GetId())} // 注釋這一行,并 return nil return nil } case 1: // balance by leader srcRegion, newLeader := h.balanceByLeader(cluster, h.stats.writeStatAsLeader) if srcRegion != nil { schedulerCounter.WithLabelValues(h.GetName(), "move_leader").Inc() // step := schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // 修改為不返回值或者返回 _ _ = schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // return []*schedule.Operator{schedule.NewOperator("transferHotWriteLeader", srcRegion.GetID(), srcRegion.GetRegionEpoch(), schedule.OpHotRegion|schedule.OpLeader, step)} // 注釋這一行,并 return nil return nil } } } schedulerCounter.WithLabelValues(h.GetName(), "skip").Inc() return nil }
當(dāng)修改了 PD 再重新編譯得到 pd-server,將其放到
tidb-ansible/resources/bin/pd-server 并替換原來的文件,然后執(zhí)行
ansible-playbook rolling_update.yml --tags=pd,即可重啟 pd-server 服務(wù)。
在調(diào)優(yōu)的過程中發(fā)現(xiàn),當(dāng)前 hot-region-scheduler 的調(diào)度時對于目標(biāo)機器的選擇并不是最優(yōu)的,代碼如下:
https://github.com/pingcap/pd/blob/master/server/schedulers/hot_region.go#L374
簡述:循環(huán)遍歷 candidateStoreIDs 的時候,如果滿足條件有多臺,那么最后一個總會覆蓋前面已經(jīng)存儲到 destStoreID 里面的數(shù)據(jù),最終我們拿到的 destStoreID 有可能不是最優(yōu)的。
// selectDestStore selects a target store to hold the region of the source region. // We choose a target store based on the hot region number and flow bytes of this store. func (h *balanceHotRegionsScheduler) selectDestStore(candidateStoreIDs []uint64, regionFlowBytes uint64, srcStoreID uint64, storesStat core.StoreHotRegionsStat) (destStoreID uint64) { sr := storesStat[srcStoreID] srcFlowBytes := sr.TotalFlowBytes srcHotRegionsCount := sr.RegionsStat.Len() var ( minFlowBytes uint64 = math.MaxUint64 minRegionsCount = int(math.MaxInt32) ) for _, storeID := range candidateStoreIDs { if s, ok := storesStat[storeID]; ok { if srcHotRegionsCount-s.RegionsStat.Len() > 1 && minRegionsCount > s.RegionsStat.Len() { destStoreID = storeID minFlowBytes = s.TotalFlowBytes minRegionsCount = s.RegionsStat.Len() continue // 這里 } if minRegionsCount == s.RegionsStat.Len() && minFlowBytes > s.TotalFlowBytes && uint64(float64(srcFlowBytes)*hotRegionScheduleFactor) > s.TotalFlowBytes+2*regionFlowBytes { minFlowBytes = s.TotalFlowBytes destStoreID = storeID } } else { destStoreID = storeID return } } return }4.2 PD 重要監(jiān)控指標(biāo)詳解之 HotRegion:
Hot write Region’s leader distribution:每個 TiKV 實例上是寫入熱點的 leader 的數(shù)量
Hot write Region’s peer distribution:每個 TiKV 實例上是寫入熱點的 peer 的數(shù)量
Hot write Region’s leader written bytes:每個 TiKV 實例上熱點的 leader 的寫入大小
Hot write Region’s peer written bytes:每個 TiKV 實例上熱點的 peer 的寫入大小
Hot read Region’s leader distribution:每個 TiKV 實例上是讀取熱點的 leader 的數(shù)量
Hot read Region’s peer distribution:每個 TiKV 實例上是讀取熱點的 peer 的數(shù)量
Hot read Region’s leader read bytes:每個 TiKV 實例上熱點的 leader 的讀取大小
Hot read Region’s peer read bytes:每個 TiKV 實例上熱點的 peer 的讀取大小
本次我們只 hack 驗證了 Write Region Leader 這部分,所以我們重點關(guān)注一下監(jiān)控和問題:
Hot write Region"s leader distribution
監(jiān)控數(shù)據(jù)有一定的延時(粗略估計1-2分鐘)5. 模擬熱點數(shù)據(jù)
從本地往服務(wù)器 load 數(shù)據(jù):
修改 tidb-bench 的 Makefile#load 模塊對應(yīng)的主機地址,然后執(zhí)行 make tbl, make load 即可往服務(wù)器 load 數(shù)據(jù)了。
注意,這里你也需要進(jìn)行一些配置修改:--default-character-set utf8犯的錯:受限于本地-服務(wù)器間網(wǎng)絡(luò)帶寬,導(dǎo)入數(shù)據(jù)很慢。
線上服務(wù)器上:
$ ./go-ycsb run mysql -p mysql.host=10.9.x.x -p mysql.port=4000 -p mysql.db=test1 -P workloads/workloada
注:go-ycsb 支持 insert,也支持 update,你可以根據(jù)你的需要進(jìn)行相對應(yīng)的調(diào)整 workloada#recordcount 和 workloada#operationcount 參數(shù)。
6.本地構(gòu)建 rust-nb-serverrust 一天速成……
Demo Time 的時候聽好幾個團隊都說失敗了。我以前也嘗試過,但是被編譯的速度以及耗能給擊敗了。
環(huán)境都可以把你 de 自信心擊潰。
rustup install nightly cargo run ...
Mac 本地打包 Linux 失敗:缺少 std 庫,通過 Docker 臨時解決。
7. 導(dǎo)師指導(dǎo)從比賽一開始,導(dǎo)師團就非常積極和主動,直接去每個項目組,給予直接指導(dǎo)和建議,我們遇到問題去找導(dǎo)師時,他們也非常的配合。
導(dǎo)師不僅幫我們解決問題(特別是熱點數(shù)據(jù)構(gòu)建,包括對于代碼級別的指導(dǎo)),還跟我們一起探討課題方向和實際可操作性,以及可以達(dá)到的目標(biāo)。
非常感謝?。?!
我們的準(zhǔn)備和主動性真的不足,值得反思--也希望大家以后不要怕麻煩,有問題就大膽的去問。Hackathon Demo
整個 Demo show 進(jìn)行的非常順利,為每一個團隊點贊!
很多團隊的作品都讓人尖叫,可想而知他們的作品是多么的酷炫和牛逼,印象中只有一個團隊在 Demo 環(huán)境出現(xiàn)了演示時程序崩潰的問題(用Java Netty 基于 TiKV 做的 memcache(實現(xiàn)了大部分的協(xié)議))。
Hackathon 頒獎遺憾!?。?/p>
我們 DSG 團隊榮獲三等獎+最佳創(chuàng)意兩項大獎,但是很遺憾我未能跟團隊一起分享這一刻。
因為我要趕著去火車站,所以在周日下午6點的時候,我跟隊友和一些朋友道別后,我就去火車站了,后面幾組的 Demo Show 也很非常遺憾未能參加。
得獎感言:
謝謝 DSG 團隊,謝謝導(dǎo)師,謝謝評委老師,謝謝 PingCAP 給大家籌備了這么好的一次黑客馬拉松比賽活動。
TiDB Hackathon 2018 總結(jié)本次比賽的各個方面都做的完美,除了網(wǎng)絡(luò)。
環(huán)境(一定要提前準(zhǔn)備)----這次被坑了不少時間和精力;
配置文檔中有一些注意事項,一定要認(rèn)真閱讀:ext4 必須要每臺機器都更新;
可以在執(zhí)行的時候增加參數(shù)來避免
ansible-playbook bootstrap.yml --extra-vars "dev_mode=True"
如果磁盤掛載有問題,可以重新清除數(shù)據(jù)后再重新啟動;
ansible-playbook unsafe_cleanup_data.yml
(https://github.com/pingcap/docs/blob/master/op-guide/ansible-operation.md)
參考資料https://github.com/pingcap/pd
tidb-bench tpch
https://github.com/pingcap/go-ycsb
Ansible 部署
PD 重要監(jiān)控指標(biāo)詳解
使用 TiDB-Ansible 升級 TiDB
在線代碼格式化
rust-nb-server
后續(xù)楊文同學(xué)會在 個人博客 中更新更多項目細(xì)節(jié)。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/17834.html
摘要:在上,我司聯(lián)合創(chuàng)始人崔秋帶大家一起回顧了年社區(qū)成長足跡,在社區(qū)榮譽時刻環(huán)節(jié),我們?yōu)樾聲x授予了證書,并為年度最佳貢獻(xiàn)個人團隊頒發(fā)了榮譽獎杯。同時,我們也為新晉授予了證書,并為年最佳社區(qū)貢獻(xiàn)個人最佳社區(qū)貢獻(xiàn)團隊頒發(fā)了榮譽獎杯。 2018 年 TiDB 產(chǎn)品變得更加成熟和穩(wěn)定,同時 TiDB 社區(qū)力量也在發(fā)展壯大。在 TiDB DevCon 2019 上,我司聯(lián)合創(chuàng)始人崔秋帶大家一起回顧了 ...
摘要:本文由紅鳳凰粉鳳凰粉紅鳳凰隊的成員主筆,他們的項目在本屆中獲得了二等獎。用戶在平臺上進(jìn)行第一章部署的學(xué)習(xí),了解到可以通過進(jìn)行部署。收到事件后,更新。由于位置是由屬性給出的,因此為其加上,即可實 本文由紅鳳凰粉鳳凰粉紅鳳凰隊的成員主筆,他們的項目 TiDB Lab?在本屆 TiDB Hackathon 2018 中獲得了二等獎。TiDB Lab 為 TiDB 培訓(xùn)體系增加了一個可以動態(tài)觀...
閱讀 2689·2021-11-16 11:53
閱讀 2757·2021-07-26 23:38
閱讀 2085·2019-08-30 15:55
閱讀 1766·2019-08-30 13:21
閱讀 3692·2019-08-29 17:26
閱讀 3319·2019-08-29 13:20
閱讀 888·2019-08-29 12:20
閱讀 3212·2019-08-26 10:21