Kubernetes中,每个Node节点上都有 kubelet ,Container Probe 也就是容器的健康检查是由 kubelet 定期执行的,kubelet 的主要功能就是定时从某个地方获取节点上 pod/container 的期望状态(运行什么容器、运行的副本数量、网络或者存储如何配置等等),并调用对应的容器平台接口达到这个状态。
Kubelet通过调用Pod中容器的Handler来执行检查的动作,Handler有三种类型。
- ExecAction,在容器中执行特定的命令,命令退出返回0表示成功
- TCPSocketAction,根据容器IP地址及特定的端口进行TCP检查,端口开放表示成功
- HTTPGetAction,根据容器IP、端口及访问路径发起一次HTTP请求,如果返回码在200到400之间表示成功
每种检查动作都可能有三种返回状态。- Success,表示通过了健康检查
- Failure,表示没有通过健康检查
- Unknown,表示检查动作失败
在创建Pod时,可以通过liveness
和readiness
两种方式来探测Pod内容器的运行情况。
liveness
可以用来检查容器内应用的存活的情况来,如果检查失败会杀掉容器进程,是否重启容器则取决于Pod的重启策略。
readiness
检查容器内的应用是否能够正常对外提供服务,如果探测失败,则Endpoint Controller会将这个Pod的IP从服务中删除。
Kubernetes会维持Pod的状态及个数,因此如果你只是希望保持Pod内容器失败后能够重启,那么其实没有必要添加健康检查,只需要合理配置Pod的重启策略即可。更适合健康检查的场景是在我们根据检查结果需要主动杀掉容器并重启的场景,还有一些容器在正式提供服务之前需要加载一些数据,那么可以采用readiness来检查这些动作是否完成。
- liveness 检查实例
1.1 Container Exec
apiVersion: apps/v1beta1
kind: Deployment
metadata:
name: testcs
namespace: cs
labels:
k8s-app: testcs
spec:
replicas: 1
selector:
matchLabels:
k8s-app: testcs
template:
metadata:
labels:
k8s-app: testcs
spec:
nodeSelector:
iwhalecloud.com/role: cs
containers:
- image: registry.paas/cs/testcs:20191016
name: testcs
imagePullPolicy: Always
ports:
- containerPort: 8080
name: testcs
volumeMounts:
- name: csdir
mountPath: /zte
- name: localtime
mountPath: /etc/localtime
securityContext:
capabilities:
add: ["SYS_PTRACE"]
args:
- /bin/sh
- -c
- touch /c6K8S/living; sleep 60; rm -rf /c6K8S/living; sleep 600
livenessProbe:
exec:
command:
- cat
- /c6K8S/living
initialDelaySeconds: 30
periodSeconds: 30
volumes:
- name: csdir
nfs:
server: 133.88.188.258
path: /c6K8S
- name: localtime
hostPath:
path: /etc/localtime
本例创建了一个容器,通过检查一个文件是否存在来判断容器运行是否正常。容器运行30秒后,将文件删除,这样容器的liveness检查失败从而会将容器重启。
1.2 HTTP Health Check
apiVersion: apps/v1beta1
kind: Deployment
metadata:
name: testcs
namespace: cs
labels:
k8s-app: testcs
spec:
replicas: 1
selector:
matchLabels:
k8s-app: testcs
template:
metadata:
labels:
k8s-app: testcs
spec:
nodeSelector:
iwhalecloud.com/role: cs
containers:
- image: registry.paas/cs/testcs:20191016
name: testcs
imagePullPolicy: Always
ports:
- containerPort: 8080
name: testcs
volumeMounts:
- name: csdir
mountPath: /zte
- name: localtime
mountPath: /etc/localtime
securityContext:
capabilities:
add: ["SYS_PTRACE"]
livenessProbe:
httpGet:
path: /cs/abc.html
port: 8080
initialDelaySeconds: 30
periodSeconds: 30
volumes:
- name: csdir
nfs:
server: 133.88.188.258
path: /c6K8S
- name: localtime
hostPath:
path: /etc/localtime
本例子通过创建一个Apache Tomcat服务,通过访问 abc.html 来判断服务是否存活。通过进入容器内部手工删除这个文件的方式,可以导致检查失败,从而重启容器。
1.3 TCP Socket
这种方式通过TCP连接来判断是否存活,Pod编排示例。
apiVersion: apps/v1beta1
kind: Deployment
metadata:
name: testcs
namespace: cs
labels:
k8s-app: testcs
spec:
replicas: 1
selector:
matchLabels:
k8s-app: testcs
template:
metadata:
labels:
k8s-app: testcs
spec:
nodeSelector:
iwhalecloud.com/role: cs
containers:
- image: registry.paas/cs/testcs:20191016
name: testcs
imagePullPolicy: Always
ports:
- containerPort: 8080
name: testcs
volumeMounts:
- name: csdir
mountPath: /zte
- name: localtime
mountPath: /etc/localtime
securityContext:
capabilities:
add: ["SYS_PTRACE"]
readinessProbe:
tcpSocket:
port: 8080
initialDelaySeconds: 10
periodSeconds: 10
livenessProbe:
tcpSocket:
port: 8080
initialDelaySeconds: 30
periodSeconds: 30
volumes:
- name: csdir
nfs:
server: 133.88.188.258
path: /c6K8S
- name: localtime
hostPath:
path: /etc/localtime
readiness 检查实例
另一种 readiness配置方式和liveness类似,只要修改livenessProbe改为readinessProbe即可。配置参数
我们可以通过kubectl explain命令来查看具体的配置属性,在这里还是简单列一下主要的属性。
initialDelaySeconds:检查开始执行的时间,以容器启动完成为起点计算
periodSeconds:检查执行的周期,默认为10秒,最小为1秒
timeoutSeconds:检查超时的时间,默认为1秒,最小为1秒
successThreshold:从上次检查失败后重新认定检查成功的检查次数阈值(必须是连续成功),默认为1
failureThreshold:从上次检查成功后认定检查失败的检查次数阈值(必须是连续失败),默认为1
httpGet的属性
host:主机名或IP
scheme:链接类型,HTTP或HTTPS,默认为HTTP
path:请求路径
httpHeaders:自定义请求头
port:请求端口