八、K8S之HPA自动扩缩容

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

HPA

一、概念

HPAHorizontal Pod Autoscaler水平 Pod 自动伸缩是 Kubernetes 中的一种特性其作用是根据资源使用情况自动调整 Pod 的副本数以实现应用程序的自动扩展和收缩。

HPA 可以根据 CPU 使用率或其他自定义指标来自动扩展或收缩 Pod。每隔30s可以通过–horizontal-pod-autoscaler-sync-period修改查询metrics的资源使用情况Pod 的 CPU 使用率超过了 HPA 的目标值那么 HPA 将创建更多的 Pod 来处理更多的工作负载。反之如果 CPU 使用率降低那么 HPA 将删除一些 Pod 以减少资源消耗。这使得集群可以根据负载需求动态扩展或收缩应用程序。

HPA 常用于处理负载波动的应用程序例如 Web 服务器、API 服务等。通过设置合适的 HPA 目标值和最小/最大 Pod 数量可以确保集群始终保持在正确的资源使用级别从而避免资源浪费和服务中断。通常用于 Deployment不适用于无法扩/缩容的对象如 DaemonSet

在创建 HPA 时您需要指定以下参数:

  • 目标资源每个 Pod 根据 HPA 所监视的资源管理器对象进行计算。
  • 目标平均使用率这是指将资源用量如 CPU 或内存与每个 Pod 的请求资源量相对比。HPA 根据此指标确定要在群集中启动的 Pod 的数量。
  • 最小 Pod 数量和最大 Pod 数量根据当前的负载情况HPA 将自动扩展或收缩 Pod 的数量但是不能超出设置的最小和最大 Pod 数量。

通过 HPA 功能Kubernetes 可以轻松地管理和调整应用程序的资源使用提高了应用程序的可用性和容错性在高负载时提供更好的响应能力并减少了内存和 CPU 等资源的浪费。

二、使用

  • 创建
kubectl  autoscale deploy nginx-deploy --cpu-percent=20 --min=2 --max=5
  • 获取 HPA 信息
kubectl get hpa 

三、测试脚本

while true; do wget -q -O- http://192.168.31.100:30906 > /dev/null ; done
阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: k8s