Kubernetes Expansion and Contraction

在实际生产系统中，经常会遇到某个服务需要扩容的场景，也可能会遇到由于资源紧张或者工作负载降低而需要减少服务示例数量的场景。因此可以利用 Deployment/RC 的 Scale 机制来完成这些工作。

Kubernetes 的 Pod 的扩容和缩容操作提供了手动和自动两种，手动模式提供执行 kubectl 命令对一个 Deployment/RC 进行 Pod 副本数量的设置，即可一键完成。自动模式则需要用户根据某个性能指标或者自定义业务指标，并制定 Pod 副本数量的范围，系统将自动在这个范围内根据性能指标的变化进行调整。

手动扩容和缩容模式

在 Deployment Nginx 为例：

nginx-deployment.yaml

apiVersion: apps/v1beta1

kind: Deployment

metadata:

spec:

replicas: 3

template:

metadata:

labels:

app: nginx

spec:

containers:

- name: nginx

image: nginx:1.7.9

ports:

- containerPort: 80

创建服务：

$ kubectl apply -f nginx-deployment.yaml

deployment "nginx-deployment" created

已运行的 Pod 副本数量为 3 个：

$ kubectl get pods

NAME READY STATUS RESTARTS AGE

nginx-deployment-569477d6d8-44xsn 1/1 Running 0 27s

nginx-deployment-569477d6d8-g4b8f 1/1 Running 0 27s

nginx-deployment-569477d6d8-sdfsm 1/1 Running 0 27s

通过 kubectl scale 命令可以将 Pod 副本数量从初始的 3 更新为 5：

$ kubectl scale deployment nginx-deployment --replicas 5

deployment "nginx-deployment" scaled

查看 Pod 数量：

$ kubectl get pods

NAME READY STATUS RESTARTS AGE

nginx-deployment-569477d6d8-44xsn 1/1 Running 0 1m

nginx-deployment-569477d6d8-bqm2b 1/1 Running 0 16s

nginx-deployment-569477d6d8-dmgfk 1/1 Running 0 16s

nginx-deployment-569477d6d8-g4b8f 1/1 Running 0 1m

nginx-deployment-569477d6d8-sdfsm 1/1 Running 0 1m

将 --replicas 设置为比当前 Pod 副本数量更小的数，系统会将 “杀掉” 一些运行中的 Pod，以实现应用集群缩容：

$ kubectl scale deployment nginx-deployment --replicas=1

deployment "nginx-deployment" scaled

$ kubectl get pods

NAME READY STATUS RESTARTS AGE

nginx-deployment-569477d6d8-44xsn 0/1 Terminating 0 3m

nginx-deployment-569477d6d8-bqm2b 0/1 Terminating 0 1m

nginx-deployment-569477d6d8-dmgfk 0/1 Terminating 0 1m

nginx-deployment-569477d6d8-g4b8f 0/1 Terminating 0 3m

nginx-deployment-569477d6d8-sdfsm 1/1 Running 0 3m

自动扩容和伸缩模式

从 Kubernetes v1.1 版本开始，新增了名为 Horizontal Pod Autoscaler（HPA）的控制器，用于实现基于 CPU 使用率自动 Pod 扩容和缩容的功能。HPA 控制器基于 Master 的 kube-controller-manager 服务启动参数 --horizontal-pod-autoscaler-sync-period 定义的时长（默认值为 30s），周期性的检测目标 Pod 的 CPU 使用率，并在满足条件时对 ReplicationController 或 Deployment 中的 Pod 副本数量进行调整，已复核用户定义的平均 Pod CPU 使用率。Pod CPU 使用率来源于 Heapster 组件，所以需要预先安装好 Heapster。

创建 HPA 时可以使用 kubectl autoscale 命令快速创建或者使用 yaml 配置文件进行创建。

在创建 HPA 之前，需要一件存在一个 Deployment/RC 对象，并且该 Deployment/RC 中的 Pod 必须定义 resources.requests.cpu 的资源请求值，如果不设置该值，则 Heapster 将无法采集到该 Pod 的 CPU 使用情况，会导致 HPA 无法正常工作。

下面通过为一个 RC 设置 HPA，然后使用一个客户端对其进行压力测试，对 HPA 的用法进行示例。

以 php-apache 的 Deployment 为例，使用 cpu request 为 200m，为设置 limit 上限的值：

php-apache-deployment.yaml

apiVersion: apps/v1beta1

kind: Deployment

metadata:

spec:

replicas: 1

template:

metadata:

labels:

app: php-apache

spec:

containers:

- name: php-apache

image: gcr.io/google_containers/hpa-example

resources:

requests:

cpu: 200m

ports:

- containerPort: 80

创建服务：

$ kubectl apply -f php-apache-deployment.yaml

deployment "php-apache" created

再创建一个 php-apache 的 Service，提供客户端访问：

php-apache-svc.yaml

apiVersion: v1

kind: Service

metadata:

spec:

ports:

- port: 80

selector:

app: php-apache

创建服务：

$ kubectl apply -f php-apache-svc.yaml

service "php-apache" created

接下来为 Deployment 创建一个 HPA 控制器，在 1 和 10 之间调整 Pod 的副本数量，使得平均 Pod CPU 使用率维持在 50%。

使用 kubectl autoscale 命令进行创建：

$ kubectl autoscale deployment php-apache --min=1 --max=10 --cpu-percent=50

deployment "php-apache" autoscaled

或者通过 yaml 配置文件来创建 HPA，需要在 scaleTargetRef 字段指定需要管理 Deployment/RC 的名字，然后设置 minReplicas、maxReplicas 和 targetCPUUtilizationPercentage 参数：

hpa-php-apache.yaml

apiVersion: autoscaling/v1

kind: HorizontalPodAutoscaler

metadata:

spec:

scaleTargetRef:

apiVersion: apps/v1beta1

kind: Deployment

minReplicas: 1

maxReplicas: 10

targetCPUUtilizationPercentage: 50

创建服务：

$ kubectl create -f hpa-php-apache.yaml

horizontalpodautoscaler "php-apache" configured

查看已经创建的 HPA：

$ kubectl get hpa

NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE

php-apache Deployment/php-apache <unknown> / 50% 1 10 1 4m

然后创建一个 busybox Pod，用户对 php-apache 服务发起压力测试的请求：

busybox-pod.yaml

apiVersion: v1

kind: Pod

metadata:

spec:

containers:

- name: busybox

image: busybox

command: ["sleep", "3600"]

创建服务：

$ kubectl create -f busybox-pod.yaml

pod "busybox" created

进入 busybox 容器，执行一个无限循环的 wgat 命令来访问 php-apache 服务：

$ kubectl exec -it busybox sh

$ while true; do wget -q -O- http://php-apache > /dev/null; done

注意这里 wget 的目的 URL 地址是 Service 的名称 “php-apache”，这要求 DNS 服务正常工作，也可以使用 Service 的虚拟 ClusterIP 地址对其进行访问，例如http://169.169.122.145:

等待一段时间后，观察 HPA 控制器搜集到的 Pod CPU 使用率：

$ kubectl get hpa

再过一会，查看 Deployment 副本数的变化：

$ kubectl get deployment php-apache

可以看到 HPA 已经根据 Pod 的 CPU 使用率的提高对 Deployment 进行了自动扩容，Pod 的副本数量变成了 10 个。

最后停止压力测试，在 busybox 的控制台输入 Ctrl+C，停止无限循环操作。

等待一段时间，观察 HPA 的变化：

$ kubectl get hpa

再次查看 Deployment 的副本数量：

$ kubectl get deployment php-apache

可以看到 HPA 根据 Pod CPU 使用率的降低对副本数量进行了缩容操作，Pod 副本数量变成了 1 个。

当前 HPA 还只支持将 CPU 使用率作为 Pod 副本扩容和缩容的触发条件，在将来的版本中，将会支持应用自定义指标（例如每秒请求数量、请求平均响应时间或其他业务指标）作为触发条件。

Kubernetes Expansion and Contraction

Kubernetes Expansion and Contraction

相关阅读更多精彩内容

友情链接更多精彩内容