TiDB Operator 源码阅读 (二) Operator 模式

返回全部

陈逸文产品技术解读 2021-03-19

在上一篇文章中我们讨论了 TiDB Operator 的应用场景，了解了 TiDB Operator 可以在 Kubernetes 集群中管理 TiDB 的生命周期。可是，TiDB Operator 的代码是怎样运行起来的？TiDB 组件的生命周期管理的逻辑又是如何编排的呢？我们将从 Operator 模式的视角，介绍 TiDB Operator 的代码实现，在这篇文章中我们主要讨论 controller-manager 的实现，介绍从代码入口到组件的生命周期事件被触发中间的过程。

Operator模式的演化: 从 Controller 模式到 Operator 模式

TiDB Operator 参考了 kube-controller-manager 的设计，了解 Kubernetes 的设计有助于了解 TiDB Operator 的代码逻辑。Kubernetes 内的 Resources 都是通过 Controller 实现生命周期管理的，例如 Namespace、Node、Deployment、Statefulset 等等，这些 Controller 的代码在 kube-controller-manager 中实现并由 kube-controller-manager 启动后调用。

为了支持用户自定义资源的开发需求，Kubernetes 社区基于上面的开发经验，提出了 Operator 模式。Kubernetes 支持通过 CRD（CustomResourceDefinition）来描述自定义资源，通过 CRD 创建 CR（CustomResource）对象，开发者实现相应 Controller 处理 CR 及关联资源的变更的需求，通过比对资源最新状态和期望状态，逐步完成运维操作，实现最终资源状态与期望状态一致。通过定义 CRD 和实现对应 Controller，无需将代码合并到 Kubernetes 中编译使用，即可完成一个资源的生命周期管理。

TiDB Operator 的 Controller Manager

TiDB Operator 使用 tidb-controller-manager 管理各个 CRD 的 Controller。从 cmd/controller-manager/main.go 开始，tidb-controller-manager 首先加载了 kubeconfig，用于连接 kube-apiserver，然后使用一系列 NewController 函数，加载了各个 Controller 的初始化函数。

控制器:控制器{tidbcluster =[]。NewController(deps), dmcluster.NewController(deps), backup.NewController(deps), restore.NewController(deps), backupschedule.NewController(deps), tidbinitializer.NewController(deps), tidbmonitor.NewController(deps), }

在 Controller 的初始化函数过程中，会初始化一系列 Informer，这些 Informer 主要用来和 kube-apiserver 交互获取 CRD 和相关资源的变更。以 TiDBCluster 为例，在初始化函数 NewController 中，会初始化 Informer 对象：

tidbClusterInformer.Informer().AddEventHandler(cache.ResourceEventHandlerFuncs{ AddFunc: c.enqueueTidbCluster, UpdateFunc:func(old, curinterface{}){ c.enqueueTidbCluster(cur) }, DeleteFunc: c.enqueueTidbCluster, }) statefulsetInformer.Informer().AddEventHandler(cache.ResourceEventHandlerFuncs{ AddFunc: c.addStatefulSet, UpdateFunc:func(old, curinterface{}){ c.updateStatefulSet(old, cur) }, DeleteFunc: c.deleteStatefulSet, })

Informer 中添加了处理添加，更新，删除事件的 EventHandler，把监听到的事件涉及到的 CR 的 Key 加入队列。

初始化完成后启动 InformerFactory 并等待 cache 同步完成。

informerFactories := []InformerFactory{ deps.InformerFactory, deps.KubeInformerFactory, deps.LabelFilterKubeInformerFactory, }for_, f :=rangeinformerFactories { f.Start(ctx.Done())forv, synced :=rangef.WaitForCacheSync(wait.NeverStop) {if!synced { klog.Fatalf("error syncing informer for %v", v) } } }

随后 tidb-controller-manager 会调用各个 Controller 的 Run 函数，开始循环执行 Controller 的内部逻辑。

// Start syncLoop for all controllersfor_,controller :=rangecontrollers { c := controllergowait.Forever(func(){ c.Run(cliCfg.Workers,ctx.Done()) },cliCfg.WaitDuration) }

以 TiDBCluster Controller 为例，Run 函数会启动 worker 处理工作队列。

// Run runs the tidbcluster controller.func(c *Controller)Run(workersint, stopCh <-chanstruct{}){deferutilruntime.HandleCrash()deferc.queue.ShutDown() klog.Info(“开始tidbcluster控制器”)deferklog.Info("Shutting down tidbcluster controller")fori :=0; i < workers; i++ {gowait.Until(c.worker, time.Second, stopCh) } <-stopCh }

Worker 会调用 processNextWorkItem 函数，弹出队列的元素，然后调用 sync 函数进行同步：

// worker runs a worker goroutine that invokes processNextWorkItem until the the controller's queue is closedfunc(c *Controller)worker(){forc.processNextWorkItem() { } }// processNextWorkItem dequeues items, processes them, and marks them done. It enforces that the syncHandler is never// invoked concurrently with the same key.func(c *Controller)processNextWorkItem()bool{ key, quit := c.queue.Get()ifquit {returnfalse}deferc.queue.Done(key)iferr := c.sync(key.(string)); err !=nil{ifperrors.Find(err, controller.IsRequeueError) !=nil{ klog.Infof("TidbCluster: %v, still need sync: %v, requeuing", key.(string), err) }else{ utilruntime.HandleError(fmt.Errorf("TidbCluster: %v, sync failed %v, requeuing", key.(string), err)) } c.queue.AddRateLimited(key) }else{ c.queue.Forget(key) }returntrue}

Sync 函数会根据 Key 获取对应的 CR 对象，例如这里的 TiDBCluster 对象，然后对这个 TiDBCluster 对象进行同步。

// sync syncs the given tidbcluster.func(c *Controller)sync(keystring)error{ startTime := time.Now()deferfunc(){ klog.V(4）.Infof("Finished syncing TidbCluster %q (%v)", key, time.Since(startTime)) }() ns, name, err := cache.SplitMetaNamespaceKey(key)if犯错! =nil{returnerr } tc, err := c.deps.TiDBClusterLister.TidbClusters(ns).Get(name)iferrors.IsNotFound(err) { klog.Infof("TidbCluster has been deleted %v", key)returnnil}if犯错! =nil{returnerr }returnc.syncTidbCluster(tc.DeepCopy()) }func(c *Controller)syncTidbCluster(tc *v1alpha1.TidbCluster)error{returnc.control.UpdateTidbCluster(tc) }

syncTidbCluster 函数调用 updateTidbCluster 函数，进而调用一系列组件的 Sync 函数实现 TiDB 集群管理的相关工作。在 pkg/controller/tidbcluster/tidb_cluster_control.go 的 updateTidbCluster 函数实现中，我们可以看到各个组件的 Sync 函数在这里调用，在相关调用代码注释里描述着每个 Sync 函数执行的生命周期操作事件，可以帮助理解每个组件的 Reconcile 需要完成哪些工作，例如 PD 组件:

// works that should do to making the pd cluster current state match the desired state:// - create or update the pd service// - create or update the pd headless service// - create the pd statefulset// - sync pd cluster status from pd to TidbCluster object// - upgrade the pd cluster// - scale out/in the pd cluster// - failover the pd clusteriferr := c.pdMemberManager.Sync(tc); err !=nil{returnerr }

我们将在下篇文章中介绍组件的 Sync 函数完成了哪些工作，TiDBCluster Controller 是怎样完成各个组件的生命周期管理。

小结

通过这篇文章，我们了解到 TiDB Operator 如何从 cmd/controller-manager/main.go 初始化运行和如何实现对应的 Controller 对象，并以 TidbCluster Controller 为例介绍了 Controller 从初始化到实际工作的过程以及 Controller 内部的工作逻辑。通过上面的代码运行逻辑的介绍，我们清楚了组件的生命周期控制循环是如何被触发的，问题已经被缩小到如何细化这个控制循环，添加 TiDB 特殊的运维逻辑，使得 TiDB 能在 Kubernetes 上部署和正常运行，完成其他的生命周期操作。我们将在下一篇文章中讨论如何细化这个控制循环，讨论组件的控制循环的实现。

我们介绍了社区对于 Operator 模式的探索和演化。对于一些希望使用 Operator 模式开发资源管理系统的小伙伴，Kubernetes 社区中提供了 Kubebuilder 和 Operator Framework 两个 Controller 脚手架项目。相比于参考kubernetes/sample-controller进行开发，Operator 脚手架基于kubernetes-sigs/controller-runtime生成 Controller 代码，减少了许多重复引入的模板化的代码。开发者只需要专注于完成 CRD 对象的控制循环部分即可，而不需要关心控制循环启动之前的准备工作。

如果有什么好的想法，欢迎通过#sig-k8s或pingcap/tidb-operator参与 TiDB Operator 社区交流。

相关阅读：
TiDB Operator 源码阅读 (一) 序；
TiDB Operator 源码阅读 (三) 编排组件控制循环；
TiDB Operator 源码阅读 (四) 组件的控制循环；
TiDB Operator 源码阅读 (五) 备份与恢复。

TiDB Operator 源码阅读 (二) Operator 模式

Operator模式的演化: 从 Controller 模式到 Operator 模式

TiDB Operator 的 Controller Manager

小结

目录

关于我们

资源中心

联系我们

PingCAP 公司