云原生

  • Kubernetes NUMA 感知

    TopologyManager TopologyManager 在1.18版本中处于 Beta 状态,该功能支持 CPU 和外围设备(例如 SR-IOV VF 和 GPU)的 NU…

    2024年3月1日
    005
  • admission webhook 还可以这么玩?

    项目由来 使用 kubernetes 的同学可能或多或少会有以下的实际业务或者需求场景: 为确保安全性,需要对某些资源进行删除保护,例如不允许删除 namespace、crd 定义…

    2024年3月1日
    008
  • admission webhook 花式玩法 – 发送 http(s) 请求

    本篇由来 在使用 Admission Webhook 的时候,很可能会涉及到发送 http 请求以获取某些数据。在 v0.1.1 版本中对此进行了支持,本文主要来介绍如何在 kin…

    2024年3月1日
    004
  • 调度器性能压测看过来

    背景 源于一次线上 P0 故障,一个生产集群被误操作删除(不只是业务被删,是集群也被删了),集群规模较大,在集群恢复后 Pod 进行了重新、调度的过程,整个过程(从开始恢复集群到业…

    2024年3月1日
    009
  • k8s 集群容量 – kluster capacity

    背景 容器平台的三个价值:稳定性、效率、成本,都离不开容量管理。容量管理是 Kubernetes 集群管理中非常重要的一部分。它可以确保系统中的资源得到合理的分配和使用,避免了因资…

    2024年3月1日
    006
  • High QPS for ConfigMap Get Requests

    背景 线上 k8s 集群 kube-apiserver 的 ConfigMap Get 操作 QPS 较高,且同时间段 Etcd 中 ConfigMap 资源的 Get 操作 QP…

    2024年3月1日
    008
  • High QPS for ConfigMap Get Requests – 2

    背景 线上 k8s 集群 kube-apiserver 的 ConfigMap Get 操作 QPS 较高,且同时间段 Etcd 中 ConfigMap 资源的 Get 操作 QP…

    2024年3月1日
    005
  • high QPS for configmap GET requests in kube-apiserver – 3

    背景 线上 k8s 集群 kube-apiserver 的 ConfigMap Get 操作 QPS 较高,且同时间段 Etcd 中 ConfigMap 资源的 Get 操作 QP…

    2024年3月1日
    009
  • 那些年,我们一起追过的绑核BUG

    背景 上半年遇到了一些绑核相关的 bug,分析了其原因,但没有总结整理下来,现在又碰到了,补一下作业,同时也希望可以帮助大家快速从坑里爬出来。本篇会总结绑核相关的 bug,部分官网…

    2024年3月1日
    009
  • Kubernetes 陈年老 bug – 绑核

    背景 最近遇到一个线上问题,使用了 lxcfs 的容器,跑在 cgroup v2 的机器上时,在容器内使用 top 或者 htop 看到的核数和 cpu 使用率有问题。虽然根本问题…

    2024年3月1日
    0014