成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

天真貝葉斯學(xué)習(xí)機 | TiDB Hackathon 優(yōu)秀項目分享

Anshiii / 3636人閱讀

摘要:我們非常希望本屆誕生的優(yōu)秀項目能夠在社區(qū)中延續(xù)下去,感興趣的小伙伴們可以加入進(jìn)來哦本文作者是來自團隊的楊文同學(xué),他們的項目天真貝葉斯學(xué)習(xí)機在本屆中獲得了三等獎最佳創(chuàng)意獎。比賽前一日從廣州南站出發(fā),次日抵達(dá)北京西站。

Ti Hack 系列
TiDB Hackathon 2018 共評選出六組優(yōu)秀項目,本系列文章將由這六組項目的成員主筆,分享他們的參賽經(jīng)驗和成果。我們非常希望本屆 Hackathon 誕生的優(yōu)秀項目能夠在社區(qū)中延續(xù)下去,感興趣的小伙伴們可以加入進(jìn)來哦~

本文作者是來自 DSG 團隊的楊文同學(xué),他們的項目《天真貝葉斯學(xué)習(xí)機》在本屆 Hackathon 中獲得了三等獎+最佳創(chuàng)意獎。

“在 TiDB Hackathon 2018 學(xué)習(xí)到不少東西,希望明年再來”

簡述

“pd ctl 天真學(xué)習(xí)機”

具體做法:用 naive bayes 模型來根據(jù)系統(tǒng)指標(biāo)和人的 pd ctl 調(diào)用,來得到一個模型去根據(jù)系統(tǒng)指標(biāo)去自動提供 pd ctl 調(diào)用的命令。

1.貝葉斯算法舉例

貝葉斯模型可以用來干這種事:

比如一個媽媽根據(jù)天氣預(yù)報來跟兒子在出們的時候叮囑:

天氣預(yù)報[ 晴, 溫度: 28, 風(fēng)力: 中 ], 媽媽會說 [好好玩]
天氣預(yù)報[ 雨, 溫度: 15, 風(fēng)力: 低 ], 媽媽會說 [帶上傘]
天氣預(yù)報[ 陰, 溫度: 02, 風(fēng)力: 大 ], 媽媽會說 [多穿點]...

把這些輸入輸入到貝葉斯模型里以后, 模型可以根據(jù)天氣預(yù)報來輸出:

天氣預(yù)報[ 晴, 溫度: 00, 風(fēng)力中], 模型會說 [ 多穿點:0.7, 好好玩0.2, 帶上傘0.1]
天氣預(yù)報[ 雨, 溫度: 10, 風(fēng)力大], 模型會說 [ 帶上傘:0.8, 多穿點0.1, 好好玩0.1]

這樣通過一個媽媽的叮囑就可以訓(xùn)練出一個也會根據(jù)天氣預(yù)報給出叮囑的模型。

2. 初步想法

我們可以把一個模型多帶帶的部署在一個 pod 里, 暴露一個 service ,然后集群上每次有人去調(diào)用 pd_ctl 的時候就在后臺用 rest call 到模型服務(wù)上記錄一下操作(叮囑)和當(dāng)前的系統(tǒng)指標(biāo)(好比天氣預(yù)報). 這樣慢慢用一段時間以后,積累的操作多了以后,就可以打開某個自動響應(yīng),或者打開自動建議應(yīng)該執(zhí)行的命令的功能。

這樣模型可以在某一組系統(tǒng)指標(biāo)出現(xiàn)之前類似學(xué)習(xí)過的狀態(tài)之后,給出相應(yīng)的建議,當(dāng)這些建議都很正確的時候直接讓 pd 直接采納,完全智能的自動化運作。

3. 實際 Hackathon 方案

在跟導(dǎo)師交流探討后發(fā)現(xiàn),目前 PD 已經(jīng)比較自動化了,很少需要人為介入進(jìn)行操作,需要的時候也是比較復(fù)雜的場景,或者自動化運作比較慢的場景。

我們團隊在跟多名導(dǎo)師的溝通交流下,將初步想法進(jìn)行了一些調(diào)整:

從熱點調(diào)度策略入手,用熱點調(diào)度策略的數(shù)值去用 naive bayes 模型去訓(xùn)練他們,然后再根據(jù)這些數(shù)值再去模型中去獲取建議值。

統(tǒng)計建議值和熱點調(diào)度策略進(jìn)行比較;(從開始的測試結(jié)果來看,大概有 70% 匹配,但是我們實測發(fā)現(xiàn),使用我們模型的建議值去真正的調(diào)度,熱點 region 還是非常均衡的)

三組對照試驗:不進(jìn)行調(diào)度,只打印調(diào)度數(shù)據(jù);正常使用原來的熱點調(diào)度策略;使用原來的熱點調(diào)度策略的數(shù)值,但是使用模型訓(xùn)練的建議值進(jìn)行實際調(diào)度;

Hackathon 回顧

首先,介紹一下我們團隊(DSG),分別來自:丹麥、北京(山西)、廣州。

D 先生是在比賽前一天早上到達(dá)北京的,我是比賽前一天晚上從廣州出發(fā),于比賽當(dāng)日早上 6:38 才抵達(dá)北京的。

說實話,時差和疲憊對于參賽還是有一點影響的。

廢話不多說,我就來回顧一下我的整個參賽過程。

比賽前一日 20:05 從廣州南站出發(fā),次日 6:38 抵達(dá)北京西站。

7:58 抵達(dá)地鐵西小口

8:06 經(jīng)過轉(zhuǎn)轉(zhuǎn)

8:12 抵達(dá)比賽所在地:東升科技園 C-1 樓

8:16 簽到,逛 PingCAP

8:40 跟 D 先生匯合,了解貝葉斯模型

9:20 DSG 團隊成員全部集結(jié)完畢

10:00 比賽正式開始

10:00 Hacking Time: Trello 構(gòu)建整個比賽分工、準(zhǔn)備工作、需求分析

搭建 TiDB 集群(2套)【熟悉 TiDB 集群,實操 PD-CTL】

12:17 午餐

13:00 Hacking Time: 熟悉 PD Command,貝葉斯模型,導(dǎo)師指導(dǎo),本地 TiDB 環(huán)境構(gòu)建(坑),分析 PD 熱點調(diào)度,剖析調(diào)度流程,模擬熱點數(shù)據(jù)

18:20 外出用餐(蘆月軒羊蝎子(西三旗店))【沾 D 先生的光,蹭吃蹭喝】

20:40 回到東升科技園

20:50 ~ 次日 1:10 Hacking Time: 模擬熱點數(shù)據(jù),實測調(diào)度上報和獲取模型返回結(jié)果,本地測通調(diào)度參數(shù)上報和得到模型返回值

次日 1:10 ~ 5:50 會議室休息(在此期間,我的隊友 D 先生,調(diào)好了模型,并將此模型通過 Docker 構(gòu)建部署到 PD 機器上)

次日 5:50 Hacking Time: 部署修改過的 PD 服務(wù)到線上服務(wù)器,并打通 rust-nb-server,實時上報和實時獲取模型返回結(jié)果

次日 7:30 早餐

次日 8:00 正式調(diào)試

次日 9:00 抽簽確定 Demo 時間

次日 9:00 ~ 12:00 Hacking Time: 調(diào)優(yōu)

次日 12:00 ~ 12:30 午餐時間

次日 13:00 ~ 14:00 Hacking Time: PPT,調(diào)優(yōu)

次日 14:30 ~ 18:30 Demo Time(B 站直播)



次日 18:30 ~ 19:00 頒獎(B 站直播)


Hackathon 實操 1. 搭建 TiDB 集群

完全參考文檔

測試 TiDB 集群,可能遇到的坑(MySQL 8 client On MacOSX):

mysql client connect : Unknown charset 255 (MySQL 8 Client 不支持字符集,需要指定默認(rèn)字符集為 UTF8)

mysql -hx.x.x.x --default-character-set utf8

2. 天真貝葉斯的服務(wù)接口

/model/service1?PUT 上報數(shù)據(jù):

{
  "updates": [
    [
      "transfer leader from store 7 to store 2",
      [
        {
          "feature_type": "Category",
          "name": "hotRegionsCount1",
          "value": "true"
        },
        {
          "feature_type": "Category",
          "name": "minRegionsCount1",
          "value": "true"
        },
        {
          "feature_type": "Category",
          "name": "hotRegionsCount2",
          "value": "true"
        },
        {
          "feature_type": "Category",
          "name": "minRegionsCount2",
          "value": "true"
        },
        {
          "feature_type": "Category",
          "name": "srcRegion",
          "value": "7"
        }
      ]
    ],
  ]}

/model/service1 POST 獲取模型結(jié)果:

輸入?yún)?shù):上報的參數(shù)

{
  "predictions": [
    {
      "transfer leader from store 1 to store 2": 0.27432775221072137,
      "transfer leader from store 1 to store 7": 0.6209064350448428,
      "transfer leader from store 2 to store 1": 0.024587894827775753,
      "transfer leader from store 2 to store 7": 0.01862719305134528,
      "transfer leader from store 7 to store 1": 0.02591609468013258,
      "transfer leader from store 7 to store 2": 0.03563463018518229
    }
  ]}
3. PD 集群部署

首先將 pd-server 替換到集群所在 ansible/resources/bin 目錄下,那如何讓集群上的 PD 更新生效呢?

更新:

$ ansible-playbook rolling_update.yml --tags=pd

在實操過程中, 如果你在更新到一半的時候就關(guān)門了,可能會導(dǎo)致整個 PD 掛掉(非集群環(huán)境),可能是因為邏輯不嚴(yán)謹(jǐn)所導(dǎo)致的問題

直接停止了 ansible,導(dǎo)致 PD 集群機器節(jié)點有停止的情況,這個時候你可以通過以下命令啟動它。

啟動:

$ ansible-playbook start.yml --tags=pd
4. PD 調(diào)度 4.1 取消熱點數(shù)據(jù)調(diào)度

大家都以為可以通過配置來解決:(調(diào)度開關(guān)方法: 用 config set xxx 0 來關(guān)閉調(diào)度)

配置如下:(雖然找的地方錯誤了,但是錯打錯著,我們來到了 Demo Time:

config set leader-schedule-limit 0
config set region-schedule-limit 0
scheduler add hot-region-scheduler
config show
config set leader-schedule-limit 4
config set region-schedule-limit 8

實測發(fā)現(xiàn),根本不生效,必須要改源代碼。

func (h *balanceHotRegionsScheduler) dispatch(typ BalanceType, cluster schedule.Cluster) []*schedule.Operator {
    h.Lock()
    defer h.Unlock()
    switch typ {
    case hotReadRegionBalance:
        h.stats.readStatAsLeader = h.calcScore(cluster.RegionReadStats(), cluster, core.LeaderKind)
        // return h.balanceHotReadRegions(cluster) // 將這一行注釋
    case hotWriteRegionBalance:
        h.stats.writeStatAsLeader = h.calcScore(cluster.RegionWriteStats(), cluster, core.LeaderKind)
        h.stats.writeStatAsPeer = h.calcScore(cluster.RegionWriteStats(), cluster, core.RegionKind)
        // return h.balanceHotWriteRegions(cluster) // 將這一行注釋
    }
    return nil
}

但是,我們要的不是不調(diào)度,而只是不給調(diào)度結(jié)果:

func (h *balanceHotRegionsScheduler) balanceHotReadRegions(cluster schedule.Cluster) []*schedule.Operator {
    // balance by leader
    srcRegion, newLeader := h.balanceByLeader(cluster, h.stats.readStatAsLeader)
    if srcRegion != nil {
        schedulerCounter.WithLabelValues(h.GetName(), "move_leader").Inc()
        // step := schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // 修改為不返回值或者返回 _
        _ = schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()}
        // return []*schedule.Operator{schedule.NewOperator("transferHotReadLeader", srcRegion.GetID(), srcRegion.GetRegionEpoch(), schedule.OpHotRegion|schedule.OpLeader, step)} // 注釋這一行,并 return nil
        return nil
    }

    // balance by peer
    srcRegion, srcPeer, destPeer := h.balanceByPeer(cluster, h.stats.readStatAsLeader)
    if srcRegion != nil {
        schedulerCounter.WithLabelValues(h.GetName(), "move_peer").Inc()
        return []*schedule.Operator{schedule.CreateMovePeerOperator("moveHotReadRegion", cluster, srcRegion, schedule.OpHotRegion, srcPeer.GetStoreId(), destPeer.GetStoreId(), destPeer.GetId())}
    }
    schedulerCounter.WithLabelValues(h.GetName(), "skip").Inc()
    return nil
}

......

func (h *balanceHotRegionsScheduler) balanceHotWriteRegions(cluster schedule.Cluster) []*schedule.Operator {
    for i := 0; i < balanceHotRetryLimit; i++ {
        switch h.r.Int() % 2 {
        case 0:
            // balance by peer
            srcRegion, srcPeer, destPeer := h.balanceByPeer(cluster, h.stats.writeStatAsPeer)
            if srcRegion != nil {
                schedulerCounter.WithLabelValues(h.GetName(), "move_peer").Inc()
                fmt.Println(srcRegion, srcPeer, destPeer)
                // return []*schedule.Operator{schedule.CreateMovePeerOperator("moveHotWriteRegion", cluster, srcRegion, schedule.OpHotRegion, srcPeer.GetStoreId(), destPeer.GetStoreId(), destPeer.GetId())} // 注釋這一行,并 return nil
                return nil
            }
        case 1:
            // balance by leader
            srcRegion, newLeader := h.balanceByLeader(cluster, h.stats.writeStatAsLeader)
            if srcRegion != nil {
                schedulerCounter.WithLabelValues(h.GetName(), "move_leader").Inc()
                // step := schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()} // 修改為不返回值或者返回 _
                _ = schedule.TransferLeader{FromStore: srcRegion.GetLeader().GetStoreId(), ToStore: newLeader.GetStoreId()}

                // return []*schedule.Operator{schedule.NewOperator("transferHotWriteLeader", srcRegion.GetID(), srcRegion.GetRegionEpoch(), schedule.OpHotRegion|schedule.OpLeader, step)} // 注釋這一行,并 return nil
                return nil
            }
        }
    }

    schedulerCounter.WithLabelValues(h.GetName(), "skip").Inc()
    return nil
}

當(dāng)修改了 PD 再重新編譯得到 pd-server,將其放到

tidb-ansible/resources/bin/pd-server 并替換原來的文件,然后執(zhí)行

ansible-playbook rolling_update.yml --tags=pd,即可重啟 pd-server 服務(wù)。

在調(diào)優(yōu)的過程中發(fā)現(xiàn),當(dāng)前 hot-region-scheduler 的調(diào)度時對于目標(biāo)機器的選擇并不是最優(yōu)的,代碼如下:

https://github.com/pingcap/pd/blob/master/server/schedulers/hot_region.go#L374

簡述:循環(huán)遍歷 candidateStoreIDs 的時候,如果滿足條件有多臺,那么最后一個總會覆蓋前面已經(jīng)存儲到 destStoreID 里面的數(shù)據(jù),最終我們拿到的 destStoreID 有可能不是最優(yōu)的。

// selectDestStore selects a target store to hold the region of the source region.
// We choose a target store based on the hot region number and flow bytes of this store.
func (h *balanceHotRegionsScheduler) selectDestStore(candidateStoreIDs []uint64, regionFlowBytes uint64, srcStoreID uint64, storesStat core.StoreHotRegionsStat) (destStoreID uint64) {
    sr := storesStat[srcStoreID]
    srcFlowBytes := sr.TotalFlowBytes
    srcHotRegionsCount := sr.RegionsStat.Len()

    var (
        minFlowBytes    uint64 = math.MaxUint64
        minRegionsCount        = int(math.MaxInt32)
    )
    for _, storeID := range candidateStoreIDs {
        if s, ok := storesStat[storeID]; ok {
            if srcHotRegionsCount-s.RegionsStat.Len() > 1 && minRegionsCount > s.RegionsStat.Len() {
                destStoreID = storeID
                minFlowBytes = s.TotalFlowBytes
                minRegionsCount = s.RegionsStat.Len()
                continue // 這里
            }
            if minRegionsCount == s.RegionsStat.Len() && minFlowBytes > s.TotalFlowBytes &&
                uint64(float64(srcFlowBytes)*hotRegionScheduleFactor) > s.TotalFlowBytes+2*regionFlowBytes {
                minFlowBytes = s.TotalFlowBytes
                destStoreID = storeID
            }
        } else {
            destStoreID = storeID
            return
        }
    }
    return
}
4.2 PD 重要監(jiān)控指標(biāo)詳解之 HotRegion:

Hot write Region’s leader distribution:每個 TiKV 實例上是寫入熱點的 leader 的數(shù)量

Hot write Region’s peer distribution:每個 TiKV 實例上是寫入熱點的 peer 的數(shù)量

Hot write Region’s leader written bytes:每個 TiKV 實例上熱點的 leader 的寫入大小

Hot write Region’s peer written bytes:每個 TiKV 實例上熱點的 peer 的寫入大小

Hot read Region’s leader distribution:每個 TiKV 實例上是讀取熱點的 leader 的數(shù)量

Hot read Region’s peer distribution:每個 TiKV 實例上是讀取熱點的 peer 的數(shù)量

Hot read Region’s leader read bytes:每個 TiKV 實例上熱點的 leader 的讀取大小

Hot read Region’s peer read bytes:每個 TiKV 實例上熱點的 peer 的讀取大小

本次我們只 hack 驗證了 Write Region Leader 這部分,所以我們重點關(guān)注一下監(jiān)控和問題:

Hot write Region"s leader distribution

監(jiān)控數(shù)據(jù)有一定的延時(粗略估計1-2分鐘)
5. 模擬熱點數(shù)據(jù)

從本地往服務(wù)器 load 數(shù)據(jù):

修改 tidb-bench 的 Makefile#load 模塊對應(yīng)的主機地址,然后執(zhí)行 make tbl, make load 即可往服務(wù)器 load 數(shù)據(jù)了。

注意,這里你也需要進(jìn)行一些配置修改:--default-character-set utf8

犯的錯:受限于本地-服務(wù)器間網(wǎng)絡(luò)帶寬,導(dǎo)入數(shù)據(jù)很慢。

線上服務(wù)器上:

$ ./go-ycsb run mysql -p mysql.host=10.9.x.x -p mysql.port=4000 -p mysql.db=test1 -P workloads/workloada

注:go-ycsb 支持 insert,也支持 update,你可以根據(jù)你的需要進(jìn)行相對應(yīng)的調(diào)整 workloada#recordcountworkloada#operationcount 參數(shù)。

6.本地構(gòu)建 rust-nb-server

rust 一天速成……

Demo Time 的時候聽好幾個團隊都說失敗了。我以前也嘗試過,但是被編譯的速度以及耗能給擊敗了。

環(huán)境都可以把你 de 自信心擊潰。

rustup install nightly
cargo run
...

Mac 本地打包 Linux 失敗:缺少 std 庫,通過 Docker 臨時解決。

7. 導(dǎo)師指導(dǎo)

從比賽一開始,導(dǎo)師團就非常積極和主動,直接去每個項目組,給予直接指導(dǎo)和建議,我們遇到問題去找導(dǎo)師時,他們也非常的配合。

導(dǎo)師不僅幫我們解決問題(特別是熱點數(shù)據(jù)構(gòu)建,包括對于代碼級別的指導(dǎo)),還跟我們一起探討課題方向和實際可操作性,以及可以達(dá)到的目標(biāo)。

非常感謝?。?!

我們的準(zhǔn)備和主動性真的不足,值得反思--也希望大家以后不要怕麻煩,有問題就大膽的去問。
Hackathon Demo

整個 Demo show 進(jìn)行的非常順利,為每一個團隊點贊!

很多團隊的作品都讓人尖叫,可想而知他們的作品是多么的酷炫和牛逼,印象中只有一個團隊在 Demo 環(huán)境出現(xiàn)了演示時程序崩潰的問題(用Java Netty 基于 TiKV 做的 memcache(實現(xiàn)了大部分的協(xié)議))。

Hackathon 頒獎

遺憾!?。?/p>

我們 DSG 團隊榮獲三等獎+最佳創(chuàng)意兩項大獎,但是很遺憾我未能跟團隊一起分享這一刻。

因為我要趕著去火車站,所以在周日下午6點的時候,我跟隊友和一些朋友道別后,我就去火車站了,后面幾組的 Demo Show 也很非常遺憾未能參加。

得獎感言:

謝謝 DSG 團隊,謝謝導(dǎo)師,謝謝評委老師,謝謝 PingCAP 給大家籌備了這么好的一次黑客馬拉松比賽活動。

TiDB Hackathon 2018 總結(jié)
本次比賽的各個方面都做的完美,除了網(wǎng)絡(luò)。

環(huán)境(一定要提前準(zhǔn)備)----這次被坑了不少時間和精力;

配置文檔中有一些注意事項,一定要認(rèn)真閱讀:ext4 必須要每臺機器都更新;

可以在執(zhí)行的時候增加參數(shù)來避免

ansible-playbook bootstrap.yml --extra-vars "dev_mode=True"

如果磁盤掛載有問題,可以重新清除數(shù)據(jù)后再重新啟動;

ansible-playbook unsafe_cleanup_data.yml

(https://github.com/pingcap/docs/blob/master/op-guide/ansible-operation.md)

參考資料

https://github.com/pingcap/pd

tidb-bench tpch

https://github.com/pingcap/go-ycsb

Ansible 部署

PD 重要監(jiān)控指標(biāo)詳解

使用 TiDB-Ansible 升級 TiDB

在線代碼格式化

rust-nb-server

后續(xù)楊文同學(xué)會在 個人博客 中更新更多項目細(xì)節(jié)。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/17834.html

相關(guān)文章

  • TiDB 社區(qū)成長足跡與小紅花 | TiDB DevCon 2019

    摘要:在上,我司聯(lián)合創(chuàng)始人崔秋帶大家一起回顧了年社區(qū)成長足跡,在社區(qū)榮譽時刻環(huán)節(jié),我們?yōu)樾聲x授予了證書,并為年度最佳貢獻(xiàn)個人團隊頒發(fā)了榮譽獎杯。同時,我們也為新晉授予了證書,并為年最佳社區(qū)貢獻(xiàn)個人最佳社區(qū)貢獻(xiàn)團隊頒發(fā)了榮譽獎杯。 2018 年 TiDB 產(chǎn)品變得更加成熟和穩(wěn)定,同時 TiDB 社區(qū)力量也在發(fā)展壯大。在 TiDB DevCon 2019 上,我司聯(lián)合創(chuàng)始人崔秋帶大家一起回顧了 ...

    hlcfan 評論0 收藏0
  • TiDB Lab 誕生記 | TiDB Hackathon 優(yōu)秀項目分享

    摘要:本文由紅鳳凰粉鳳凰粉紅鳳凰隊的成員主筆,他們的項目在本屆中獲得了二等獎。用戶在平臺上進(jìn)行第一章部署的學(xué)習(xí),了解到可以通過進(jìn)行部署。收到事件后,更新。由于位置是由屬性給出的,因此為其加上,即可實 本文由紅鳳凰粉鳳凰粉紅鳳凰隊的成員主筆,他們的項目 TiDB Lab?在本屆 TiDB Hackathon 2018 中獲得了二等獎。TiDB Lab 為 TiDB 培訓(xùn)體系增加了一個可以動態(tài)觀...

    asoren 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<