成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

k8s與網(wǎng)絡(luò)--Flannel源碼分析

hoohack / 3111人閱讀

摘要:今天主要針對(duì)版本進(jìn)行源碼分析。外部接口的定義如下創(chuàng)建子網(wǎng)管理器負(fù)責(zé)子網(wǎng)的創(chuàng)建更新添加刪除監(jiān)聽(tīng)等,主要和打交道定義續(xù)約。在到期之前,子網(wǎng)管理器調(diào)用該方法進(jìn)行續(xù)約。

前言

之前在k8s與網(wǎng)絡(luò)--Flannel解讀一文中,我們主要講了Flannel整體的工作原理。今天主要針對(duì)Flannel v0.10.0版本進(jìn)行源碼分析。首先需要理解三個(gè)比較重要的概念:

網(wǎng)絡(luò)(Network):整個(gè)集群中分配給 flannel 要管理的網(wǎng)絡(luò)地址范圍

子網(wǎng)(Subnet):flannel 所在的每臺(tái)主機(jī)都會(huì)管理 network 中一個(gè)子網(wǎng),子網(wǎng)的掩碼和范圍是可配置的

后端(Backend):使用什么樣的后端網(wǎng)絡(luò)模型,比如默認(rèn)的 udp,還是 vxlan 等

源碼分析

整體的代碼組織如下:

除了可執(zhí)行文件的入口 main.go之外,有backend,network,pkg和subnet這么幾個(gè)代碼相關(guān)的文件夾。

network主要是iptables相關(guān)。主要是供main函數(shù)根據(jù)設(shè)置進(jìn)行MasqRules和ForwardRules規(guī)則的設(shè)定。

pkg主要是抽象封裝的ip功能庫(kù)。

backed 主要是后端實(shí)現(xiàn),目前支持 udp、vxlan、host-gw 等。

subnet 子網(wǎng)管理。主要支持etcdv2和k8s兩種實(shí)現(xiàn)。

啟動(dòng)參數(shù)
name 默認(rèn)值 說(shuō)明
etcd-endpoints http://127.0.0.1:4001,http://127.0.0.1:2379 etcd終端節(jié)點(diǎn)列表
etcd-prefix /coreos.com/network etcd 前綴
etcd-keyfile 無(wú) SSL key文件
etcd-certfile 無(wú) SSL certification 文件
etcd-cafile 無(wú) SSL Certificate Authority 文件
etcd-username 無(wú) 通過(guò)BasicAuth訪問(wèn)etcd 的用戶(hù)名
etcd-password 無(wú) 通過(guò)BasicAuth訪問(wèn)etcd 的密碼
iface 無(wú) 完整的網(wǎng)卡名或ip地址
iface-regex 無(wú) 正則表達(dá)式表示的網(wǎng)卡名或ip地址
subnet-file /run/flannel/subnet.env 存放運(yùn)行時(shí)需要的一些變量 (subnet, MTU, ... )的文件名
public-ip 無(wú) 主機(jī)IP
subnet-lease-renew-margin 60分鐘 在租約到期之前多長(zhǎng)時(shí)間進(jìn)行更新
ip-masq false 是否為覆蓋網(wǎng)絡(luò)外部的流量設(shè)置IP偽裝規(guī)則
kube-subnet-mgr false 是否使用k8s作為subnet的實(shí)現(xiàn)方式
kube-api-url "" Kubernetes API server URL ,如果集群內(nèi)部署,則不需要設(shè)置,做好rbac授權(quán)即可
kubeconfig-file "" kubeconfig file 位置,如果集群內(nèi)部署,則不需要設(shè)置,做好rbac授權(quán)即可
healthz-ip 0.0.0.0 要監(jiān)聽(tīng)的healthz服務(wù)器的IP地址
healthz-port 0 要監(jiān)聽(tīng)的healthz服務(wù)器的端口,0 表示停用
分析

從main函數(shù)開(kāi)始分析,主要步驟如下:

1. 校驗(yàn)subnet-lease-renew-margin
if opts.subnetLeaseRenewMargin >= 24*60 || opts.subnetLeaseRenewMargin <= 0 {
        log.Error("Invalid subnet-lease-renew-margin option, out of acceptable range")
        os.Exit(1)
    }

需要小于等于24h,大于0。

2. 計(jì)算去使用哪一個(gè)網(wǎng)絡(luò)接口

假如主機(jī)有多個(gè)網(wǎng)卡,flannel會(huì)使用哪一個(gè)?
這就和咱們前面提到的iface和iface-regex兩個(gè)參數(shù)有關(guān)。這兩個(gè)參數(shù)每一個(gè)可以指定多個(gè)。flannel將按照下面的優(yōu)先順序來(lái)選?。?br>1) 如果”–iface”和”—-iface-regex”都未指定時(shí),則直接選取默認(rèn)路由所使用的輸出網(wǎng)卡

2) 如果”–iface”參數(shù)不為空,則依次遍歷其中的各個(gè)實(shí)例,直到找到和該網(wǎng)卡名或IP匹配的實(shí)例為止

3) 如果”–iface-regex”參數(shù)不為空,操作方式和2)相同,唯一不同的是使用正則表達(dá)式去匹配

最后,對(duì)于集群間交互的Public IP,我們同樣可以通過(guò)啟動(dòng)參數(shù)”–public-ip”進(jìn)行指定。否則,將使用上文中獲取的網(wǎng)卡的IP作為Public IP。

外部接口的定義如下:

type ExternalInterface struct {
    Iface     *net.Interface
    IfaceAddr net.IP
    ExtAddr   net.IP
}
3.創(chuàng)建SubnetManager
func newSubnetManager() (subnet.Manager, error) {
    if opts.kubeSubnetMgr {
        return kube.NewSubnetManager(opts.kubeApiUrl, opts.kubeConfigFile)
    }

    cfg := &etcdv2.EtcdConfig{
        Endpoints: strings.Split(opts.etcdEndpoints, ","),
        Keyfile:   opts.etcdKeyfile,
        Certfile:  opts.etcdCertfile,
        CAFile:    opts.etcdCAFile,
        Prefix:    opts.etcdPrefix,
        Username:  opts.etcdUsername,
        Password:  opts.etcdPassword,
    }

    // Attempt to renew the lease for the subnet specified in the subnetFile
    prevSubnet := ReadSubnetFromSubnetFile(opts.subnetFile)

    return etcdv2.NewLocalManager(cfg, prevSubnet)
}

子網(wǎng)管理器負(fù)責(zé)子網(wǎng)的創(chuàng)建、更新、添加、刪除、監(jiān)聽(tīng)等,主要和 etcd 打交道,定義:

type Manager interface {
    GetNetworkConfig(ctx context.Context) (*Config, error)
    AcquireLease(ctx context.Context, attrs *LeaseAttrs) (*Lease, error)
    RenewLease(ctx context.Context, lease *Lease) error
    WatchLease(ctx context.Context, sn ip.IP4Net, cursor interface{}) (LeaseWatchResult, error)
    WatchLeases(ctx context.Context, cursor interface{}) (LeaseWatchResult, error)

    Name() string
}

RenewLease 續(xù)約。在lease到期之前,子網(wǎng)管理器調(diào)用該方法進(jìn)行續(xù)約。

GetNetworkConfig 獲取本機(jī)的subnet配置,進(jìn)行一些初始化的工作。

4. 獲取網(wǎng)絡(luò)配置
config, err := getConfig(ctx, sm)
    if err == errCanceled {
        wg.Wait()
        os.Exit(0)
    }

這個(gè)配置主要是管理網(wǎng)絡(luò)的配置,需要在flannel啟動(dòng)之前寫(xiě)到etcd中。例如:

{
    "Network": "10.0.0.0/8",
    "SubnetLen": 20,
    "SubnetMin": "10.10.0.0",
    "SubnetMax": "10.99.0.0",
    "Backend": {
        "Type": "udp",
        "Port": 7890
    }
}

/coreos.com/network/config 保存著上面網(wǎng)絡(luò)配置數(shù)據(jù)。
詳細(xì)解讀一下:

SubnetLen表示每個(gè)主機(jī)分配的subnet大小,我們可以在初始化時(shí)對(duì)其指定,否則使用默認(rèn)配置。在默認(rèn)配置的情況下,如果集群的網(wǎng)絡(luò)地址空間大于/24,則SubnetLen配置為24,否則它比集群網(wǎng)絡(luò)地址空間小1,例如集群的大小為/25,則SubnetLen的大小為/26

SubnetMin是集群網(wǎng)絡(luò)地址空間中最小的可分配的subnet,可以手動(dòng)指定,否則默認(rèn)配置為集群網(wǎng)絡(luò)地址空間中第一個(gè)可分配的subnet。

SubnetMax表示最大可分配的subnet

BackendType為使用的backend的類(lèi)型,如未指定,則默認(rèn)為“udp”

Backend中會(huì)包含backend的附加信息,例如backend為vxlan時(shí),其中會(huì)存儲(chǔ)vtep設(shè)備的mac地址

5. 創(chuàng)建backend管理器,然后使用它來(lái)創(chuàng)建backend并使用它注冊(cè)網(wǎng)絡(luò),然后執(zhí)行run方法
    bm := backend.NewManager(ctx, sm, extIface)
    be, err := bm.GetBackend(config.BackendType)
    if err != nil {
        log.Errorf("Error fetching backend: %s", err)
        cancel()
        wg.Wait()
        os.Exit(1)
    }

    bn, err := be.RegisterNetwork(ctx, config)
    if err != nil {
        log.Errorf("Error registering network: %s", err)
        cancel()
        wg.Wait()
        os.Exit(1)
    }

...

log.Info("Running backend.")
    wg.Add(1)
    go func() {
        bn.Run(ctx)
        wg.Done()
    }()

backend管理器

type manager struct {
    ctx      context.Context
    sm       subnet.Manager
    extIface *ExternalInterface
    mux      sync.Mutex
    active   map[string]Backend
    wg       sync.WaitGroup
}

主要是提供了GetBackend(backendType string) (Backend, error)方法,根據(jù)配置文件的設(shè)置backend標(biāo)志,生產(chǎn)對(duì)應(yīng)的backend。
此處注意

    go func() {
        <-bm.ctx.Done()

        // TODO(eyakubovich): this obviosly introduces a race.
        // GetBackend() could get called while we are here.
        // Currently though, all backends" Run exit only
        // on shutdown

        bm.mux.Lock()
        delete(bm.active, betype)
        bm.mux.Unlock()

        bm.wg.Done()
    }()

在生產(chǎn)backend以后,會(huì)啟動(dòng)一個(gè)協(xié)程,在flanneld退出運(yùn)行之前,將會(huì)執(zhí)行激活的backend map中刪除操作。

最后run方法:

func (n *RouteNetwork) Run(ctx context.Context) {
    wg := sync.WaitGroup{}

    log.Info("Watching for new subnet leases")
    evts := make(chan []subnet.Event)
    wg.Add(1)
    go func() {
        subnet.WatchLeases(ctx, n.SM, n.SubnetLease, evts)
        wg.Done()
    }()

    n.routes = make([]netlink.Route, 0, 10)
    wg.Add(1)
    go func() {
        n.routeCheck(ctx)
        wg.Done()
    }()

    defer wg.Wait()

    for {
        select {
        case evtBatch := <-evts:
            n.handleSubnetEvents(evtBatch)

        case <-ctx.Done():
            return
        }
    }
}

run方法中主要是執(zhí)行:

subnet 負(fù)責(zé)和 etcd 交互,把 etcd 中的信息轉(zhuǎn)換為 flannel 的子網(wǎng)數(shù)據(jù)結(jié)構(gòu),并對(duì) etcd 進(jìn)行子網(wǎng)和網(wǎng)絡(luò)的監(jiān)聽(tīng);

backend 接受 subnet 的監(jiān)聽(tīng)事件,并做出對(duì)應(yīng)的處理。

事件主要是subnet.EventAdded和subnet.EventRemoved兩個(gè)。
添加子網(wǎng)事件發(fā)生時(shí)的處理步驟:檢查參數(shù)是否正常,根據(jù)參數(shù)構(gòu)建路由表項(xiàng),把路由表項(xiàng)添加到主機(jī),把路由表項(xiàng)添加到自己的數(shù)據(jù)結(jié)構(gòu)中。

刪除子網(wǎng)事件發(fā)生時(shí)的處理步驟:檢查參數(shù)是否正常,根據(jù)參數(shù)構(gòu)建路由表項(xiàng),把路由表項(xiàng)從主機(jī)刪除,把路由表項(xiàng)從管理的數(shù)據(jù)結(jié)構(gòu)中刪除

6. 其他

除了上面的核心的邏輯,還有一些iptables規(guī)則和SubnetFile相關(guān)的操作。

// Set up ipMasq if needed
    if opts.ipMasq {
        go network.SetupAndEnsureIPTables(network.MasqRules(config.Network, bn.Lease()))
    }

    // Always enables forwarding rules. This is needed for Docker versions >1.13 (https://docs.docker.com/engine/userguide/networking/default_network/container-communication/#container-communication-between-hosts)
    // In Docker 1.12 and earlier, the default FORWARD chain policy was ACCEPT.
    // In Docker 1.13 and later, Docker sets the default policy of the FORWARD chain to DROP.
    go network.SetupAndEnsureIPTables(network.ForwardRules(config.Network.String()))

可以看出主要是調(diào)用了network文件里的SetupAndEnsureIPTables方法。
PS
在Docker 1.13及更高版本中,Docker設(shè)置了FORWARD的默認(rèn)策略是drop,所以需要flannel做一些工作。

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/27460.html

相關(guān)文章

  • k8s網(wǎng)絡(luò)--Flannel源碼分析

    摘要:今天主要針對(duì)版本進(jìn)行源碼分析。外部接口的定義如下創(chuàng)建子網(wǎng)管理器負(fù)責(zé)子網(wǎng)的創(chuàng)建更新添加刪除監(jiān)聽(tīng)等,主要和打交道定義續(xù)約。在到期之前,子網(wǎng)管理器調(diào)用該方法進(jìn)行續(xù)約。 前言 之前在k8s與網(wǎng)絡(luò)--Flannel解讀一文中,我們主要講了Flannel整體的工作原理。今天主要針對(duì)Flannel v0.10.0版本進(jìn)行源碼分析。首先需要理解三個(gè)比較重要的概念: 網(wǎng)絡(luò)(Network):整個(gè)集群中...

    wpw 評(píng)論0 收藏0
  • k8s網(wǎng)絡(luò)--Flannel源碼分析

    摘要:今天主要針對(duì)版本進(jìn)行源碼分析。外部接口的定義如下創(chuàng)建子網(wǎng)管理器負(fù)責(zé)子網(wǎng)的創(chuàng)建更新添加刪除監(jiān)聽(tīng)等,主要和打交道定義續(xù)約。在到期之前,子網(wǎng)管理器調(diào)用該方法進(jìn)行續(xù)約。 前言 之前在k8s與網(wǎng)絡(luò)--Flannel解讀一文中,我們主要講了Flannel整體的工作原理。今天主要針對(duì)Flannel v0.10.0版本進(jìn)行源碼分析。首先需要理解三個(gè)比較重要的概念: 網(wǎng)絡(luò)(Network):整個(gè)集群中...

    Jeffrrey 評(píng)論0 收藏0
  • 淺談k8s cni 插件

    摘要:即配置網(wǎng)絡(luò)和解除網(wǎng)絡(luò)配置。類(lèi)類(lèi)型的插件,在執(zhí)行命令時(shí)會(huì)分配一個(gè)給調(diào)用者。執(zhí)行命令時(shí)會(huì)將調(diào)用者指定的放回池。向刪除時(shí),同樣通過(guò)請(qǐng)求,解除該的租約。組件通常在組件執(zhí)行完畢后執(zhí)行 目前不論是個(gè)人還是企業(yè),在使用k8s時(shí),都會(huì)采用CNI作為集群網(wǎng)絡(luò)方案實(shí)現(xiàn)的規(guī)范。 在早先的k8s版本中,kubelet代碼里提供了networkPlugin,networkPlugin是一組接口,實(shí)現(xiàn)了pod的網(wǎng)...

    fireflow 評(píng)論0 收藏0
  • k8s網(wǎng)絡(luò)--Flannel解讀

    摘要:是一個(gè)專(zhuān)為定制的三層網(wǎng)絡(luò)解決方案,主要用于解決容器的跨主機(jī)通信問(wèn)題。收到的數(shù)據(jù)包被轉(zhuǎn)發(fā)到進(jìn)程。查詢(xún)路由表,解封包,并將數(shù)據(jù)包發(fā)送到。然后在網(wǎng)絡(luò)層的源和目的均是容器的,虛擬。默認(rèn)也是使用容器網(wǎng)絡(luò)方案,其官網(wǎng)也清晰的畫(huà)出了的。 前言 我們知道docker官方并沒(méi)有提供多主機(jī)的容器通信方案,單機(jī)網(wǎng)絡(luò)的模式主要有host,container,brige,none。none這種模式,顧名思義就是...

    laznrbfe 評(píng)論0 收藏0
  • k8s網(wǎng)絡(luò)--Flannel解讀

    摘要:是一個(gè)專(zhuān)為定制的三層網(wǎng)絡(luò)解決方案,主要用于解決容器的跨主機(jī)通信問(wèn)題。收到的數(shù)據(jù)包被轉(zhuǎn)發(fā)到進(jìn)程。查詢(xún)路由表,解封包,并將數(shù)據(jù)包發(fā)送到。然后在網(wǎng)絡(luò)層的源和目的均是容器的,虛擬。默認(rèn)也是使用容器網(wǎng)絡(luò)方案,其官網(wǎng)也清晰的畫(huà)出了的。 前言 我們知道docker官方并沒(méi)有提供多主機(jī)的容器通信方案,單機(jī)網(wǎng)絡(luò)的模式主要有host,container,brige,none。none這種模式,顧名思義就是...

    Pink 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<