kubernetes是一个全新得基于容器技术得分布式架构领先方案。是google Borg得一个开源版本。Borg是google得一个久负盛名得内部使用得大规模集群管理系统,它基于容器技术,目的是实现资源管理的自动化,以及跨多个数据中心的资源利用率的最大化。
kubernetes中的大部分概念如Node,Pod,Replication Controller,service等都可以看作一种“资源对象”。几乎所有的资源对象都可以通过kubernetes提供的kubectl工具(或者api编程调用)执行增删查改等操作并将其保存在etcd中持久化存储。所以通过这个角度来看,kubernetes是一个高度自动化的资源控制系统。
k8s中的master是集群控制节点,来负责具体的执行过程,master节点通常会占据一个独立的服务器。一个主要原因是它太重要了,它是整个集群的“首脑"。
master节点上运行着以下一组关键进程。
- Kubernetes API Server,提供HTTP Rest接口的关键服务进程。是Kubernetes里所有资源的增删查改等操作的唯一入口,也是集群控制的入口进程。
- Kubernetes Controller Manager,Kubernetes里所有资源对象的自动化控制中心。
- Kubernetes Scheduler, 负责资源调度(Pod调度)的进程。
master节点还会启动一个etcd server进程,因为Kubernetes所有资源对象的数据全部保存在etcd中。
Node在较早版本也叫Minion,在kubernetes集群除了Master节点,其他节点被称为Node节点。node节点为k8s集群的工作负载节点,每个node都会被master分配一部分工作负载。当node宕机时,工作负载会被master转移到其他节点。
node节点主要运行着下面一组关键进程
- kubelet: 负责Pod对应容器的创建,启停等任务。同时与master节点密切协作,实现集群管理的基本功能。
- kube-proxy: 实现kubernetes Server的通信与负载均衡机制的重要组件。
- Docker Engine: 负责本机容器的创建和管理工作。
Node节点可以动态增加到Kubernetes集群中,默认情况下kubelet会向master注册自己,当Node被纳入集群管理,kubelet进程就会定时向Master节点汇报自身情报(包括docker版本,机器cpu内存),这样master会获取每个node的资源使用情况。并实现高效的资源调度策略。
Pod是kubernetes的最重要也是最基本的概念
Lebel是kubernetes系统中一个核心概念,一个label是一个kv的键值对,k、v由用户自己指定。可以附加到各种资源对象上,例如node,pod,service,rc等。
我们可以通过给指定资源捆绑一个或多个不同的资源标签,来实现多维度的资源分组管理。详细参考19页
核心概念之一,定义一个期望的场景,既声明某种Pod的副本数量字任意时刻都符合某一个预期值,所以rc的定义包括一下几个部分。
- Pod 期待的副本数
- 用于筛选目标pod的label selector
rc的一些特性和作用
- 大多数情况下,通过自定义一个rc实现pod的创建过程及副本数量的自动控制。
- rc里包含完整的pod定义模板
- rc通过label selector机制实现对pod 副本的自动控制
- 通过改变rc里的pod副本数量,实现对pod的扩容和缩容功能
- 通过改变rc里pod模板中的镜像版本,可以实现pod的滚动升级功能
deployment是kubernetes1.2引入的新概念。引入的目的是为了更好的解决pod的编排问题,可以看作是rc的一次升级。
deployment的典型使用场景有以下几个
- 创建一个deployment对象来生成对应的replica set并完成pod副本的创建过程
- 检查deployment的状态来看部署动作是否完成
- 更新deployment以创建新的pod(镜像升级)
- 如果当前deployment不稳定,回滚到早先的deployment版本
- 挂起或恢复一个deployment
Horizontal Pod Autoscaler 简称HPA,含义为pod横向自动扩容,与rc,deployment一样,也属于一种kubernet 资源对象。通过追踪分析rc控制的所有目标pod的负载变化情况,来确定是否需要针对性的调整pod的副本数。HPA当前由两种方式做为pod负载的度量指标
- CPUUtilizationPercentage
- 应用程序自定义的度量指标,比如qps和tps
Kubernetes Service 其实是我们常提起的为服务架构中的一个"微服务",前面的pod,rc等资源对象其实都是为kubernetes service做嫁衣的。
kubernetes集群中的三种ip
- node ip,node节点的物理ip地址,可以通过网络直接通信
- pod ip,是docker 引擎根据docker0网桥的ip地址段进行分配,是一个虚拟的二层网络
- cluser ip,属于kubernetes集群中的内部地址,无法在集群外部使用这个地址。
Volume 是pod中能够被多个容器访问的共享目录。概念、用途和目的与docker的vlume相似但不等价。原因如下
- kubernetes的volume定义在pod上,然后被一个pod里的多个容器挂载到具体的文件目录下
- kubernetes的volume的生命周期与pod的生命周期相同,但与容器的生命周期不相关。当容器终止或重启时volume的数据不会丢失,kubernetes支持多种类型的volume,如GlusterFS,Ceph等先进的分布式文件系统。