原创

从零开始:基于Ubuntu的Kubernetes集群部署全攻略(含国内加速配置)

温馨提示:
本文最后更新于 2025年02月26日,已超过 52 天没有更新。若文章内的图片失效(无法正常加载),请留言反馈或直接联系我

 

一、环境准备

1.1. 资源列表

操作系统

主机名

IP地址

Ubuntu2204

master

192.168.2.24

Ubuntu2204

node1

192.168.2.7

Ubuntu2204

node2

192.168.2.146

1.2. 修改主机名

在每台机器上分别执行以下命令来修改主机名,用于规范集群节点标识,确保 Kubernetes 组件能够基于主机名正确通信、调度资源并简化故障排查。

sudo hostnamectl set-hostname master
sudo hostnamectl set-hostname node1
sudo hostnamectl set-hostname node2

1.3. 建立 IP 地址与主机名的映射关系

在 Kubernetes 集群中的每个节点上配置主机名与 IP 地址的映射关系,以便节点之间可以通过主机名相互访问。切换到 root 用户并编辑 /etc/hosts 文件,添加如下内容:

sudo -i
cat >> /etc/hosts << EOF
192.168.2.24 master
192.168.2.7 node1
192.168.2.146 node2
EOF

切换到普通账号

su - ubuntu

1.4. 关闭交换分区

Kubeadm 不支持启用交换分区。永久关闭交换分区的方法如下:

# 临时关闭所有 Swap 分区,立即生效,但重启后会失效
sudo swapoff -a
# 永久禁用 Swap 分区,重启后生效
sudo sed -i '/swap/s/^/#/' /etc/fstab

1.5. 启用 IPv4 转发

为了使 Pod 能够跨节点通信,需要启用 IPv4 转发:

sudo cat <<EOF | sudo tee /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-iptables  = 1
net.bridge.bridge-nf-call-ip6tables = 1
net.ipv4.ip_forward                 = 1
EOF
sudo sysctl --system

1.6. 时间同步配置

Kubernetes及其组件(包括容器、服务网格、监控系统等)依赖于准确的时间戳来维持正确的操作和协调,安装并配置 chrony 来同步时间:

sudo apt update
sudo apt -y install chrony
echo "server ntp.aliyun.com iburst" | sudo tee -a /etc/chrony/chrony.conf
sudo systemctl restart chrony
sudo systemctl enable chrony
# 立即同步时间
sudo chronyc -a makestep

二、安装 Docker

2.1. 卸载旧版 Docker(可选)

for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done

2.2. 安装 Docker 及其依赖

sudo apt-get -y install ca-certificates curl gnupg lsb-release
curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
sudo apt-get update
sudo apt-get -y install docker-ce docker-ce-cli containerd.io

2.3. 配置 Docker 加速器

Docker 默认从 Docker Hub 拉取镜像,但由于网络原因(尤其是国内用户),拉取速度可能较慢甚至连接超时。配置镜像加速器后,Docker 会优先从国内的镜像源拉取镜像,显著提升拉取速度。

sudo tee /etc/docker/daemon.json > /dev/null <<EOF
{
    "registry-mirrors": [
        "https://registry.docker-cn.com",
        "http://hub-mirror.c.163.com",
        "https://docker.mirrors.ustc.edu.cn",
        "https://kfwkfulq.mirror.aliyuncs.com"
    ]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker

三、部署 Kubernetes

3.1. 配置 Kubernetes 的 APT 源

# GPG 密钥,用于验证软件包的真实性和完整性,确保安装的软件包安全可靠
sudo curl -fsSLo /usr/share/keyrings/kubernetes-archive-keyring.gpg https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg
# 使用阿里云的镜像源可以解决国内访问 Kubernetes 官方软件源的速度问题
echo "deb [signed-by=/usr/share/keyrings/kubernetes-archive-keyring.gpg] https://mirrors.aliyun.com/kubernetes/apt/ kubernetes-xenial main" | sudo tee /etc/apt/sources.list.d/kubernetes.list
sudo apt-get update

3.2. 安装 Kubernetes 组件

kubelet 主要负责单个节点上的容器管理;kubeadm 提供了一种便捷的方式来初始化和管理整个 Kubernetes 集群;而 kubectl 则是一个强大的命令行工具,让用户能够方便地与 Kubernetes 集群交互,执行各种管理和运维任务。这三个组件共同作用,构成了 Kubernetes 集群的基础架构。

sudo apt-get install -y kubelet=1.23.0-00 kubeadm=1.23.0-00 kubectl=1.23.0-00
sudo apt-mark hold kubelet kubeadm kubectl

3.3. 设置 Kubelet 开机启动

sudo systemctl enable kubelet

四、使用 Kubeadm 初始化集群

4.1. 生成初始化配置文件

生成一个包含默认初始化配置的 YAML 文件,该文件可以用于 Kubernetes 集群的初始化过程

kubeadm config print init-defaults > init-config.yaml

根据实际情况修改 init-config.yaml 文件中的网络配置等信息。

apiVersion: kubeadm.k8s.io/v1beta3
bootstrapTokens:
- groups:
  - system:bootstrappers:kubeadm:default-node-token
  token: abcdef.0123456789abcdef
  ttl: 24h0m0s
  usages:
  - signing
  - authentication
kind: InitConfiguration
localAPIEndpoint:
  advertiseAddress: 192.168.2.24  # master节点IP地址
  bindPort: 6443
nodeRegistration:
  criSocket: /var/run/dockershim.sock
  imagePullPolicy: IfNotPresent
  name: master   # 若域名不可解析则使用IP地址
  taints: null
---
apiServer:
  timeoutForControlPlane: 4m0s
apiVersion: kubeadm.k8s.io/v1beta3
certificatesDir: /etc/kubernetes/pki
clusterName: kubernetes
controllerManager: {}
dns: {}
etcd:
  local:
    dataDir: /var/lib/etcd
imageRepository: registry.aliyuncs.com/google_containers # 默认地址国内无法访问,修改为国内地址
kind: ClusterConfiguration
kubernetesVersion: 1.23.0
networking:
  dnsDomain: cluster.local
  serviceSubnet: 10.96.0.0/12
  podSubnet: 10.244.0.0/16  # 新增加Pod资源网段
scheduler: {}

4.2. 拉取所需镜像

先确认镜像配置是否符合预期,然后提前拉取镜像,避免初始化过程中的等待和失败。

kubeadm config images list --config=init-config.yaml
sudo kubeadm config images pull --config=init-config.yaml

4.3. 初始化 Master 节点

基于自定义配置文件初始化 Master 节点,从而正式启动 Kubernetes 控制平面

sudo kubeadm init --config=init-config.yaml

记录下输出的 kubeadm join 命令用于后续 Node 节点加入集群。

解决常见问题

如果遇到错误如 /proc/sys/net/bridge/bridge-nf-call-iptables does not exist,请加载必要的内核模块:

sudo modprobe bridge
sudo modprobe br_netfilter
echo "net.bridge.bridge-nf-call-iptables=1" | sudo tee -a /etc/sysctl.d/k8s.conf
sudo sysctl -p /etc/sysctl.d/k8s.conf

4.4. 复制认证文件

用户级 Kubernetes 配置的初始化,使得普通用户能够安全、便捷地通过 kubectl 管理集群。

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

4.5. Node节点加入集群

将一个新的节点加入到现有的 Kubernetes 集群中

sudo kubeadm join 192.168.2.24:6443 --token abcdef.0123456789abcdef \
        --discovery-token-ca-cert-hash sha256:875788a1bd44bad8e723182fcf756906957740f354207ad7e67218eed021a610

解决常见问题

如果遇到错误如 /proc/sys/net/bridge/bridge-nf-call-iptables does not exist,请加载必要的内核模块:

sudo modprobe bridge
sudo modprobe br_netfilter
echo "net.bridge.bridge-nf-call-iptables=1" | sudo tee -a /etc/sysctl.d/k8s.conf
sudo sysctl -p /etc/sysctl.d/k8s.conf

4.6. 在master主机查看节点状态

在初始化k8s-master时并没有网络相关的配置,所以无法跟node节点通信,因此状态都是“Not Ready”。但是通过kubeadm join加入的node节点已经在master上可以看到

kubectl get node

五、安装 Flannel 网络插件

下载并应用 Flannel 配置文件,实现Pod跨节点通信

wget https://raw.githubusercontent.com/flannel-io/flannel/master/Documentation/kube-flannel.yml
kubectl apply -f kube-flannel.yml

kube-flannel.yml可能无法下载,文件内容如下

---
kind: Namespace
apiVersion: v1
metadata:
  name: kube-flannel
  labels:
    k8s-app: flannel
    pod-security.kubernetes.io/enforce: privileged
---
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  labels:
    k8s-app: flannel
  name: flannel
rules:
- apiGroups:
  - ""
  resources:
  - pods
  verbs:
  - get
- apiGroups:
  - ""
  resources:
  - nodes
  verbs:
  - get
  - list
  - watch
- apiGroups:
  - ""
  resources:
  - nodes/status
  verbs:
  - patch
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  labels:
    k8s-app: flannel
  name: flannel
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: flannel
subjects:
- kind: ServiceAccount
  name: flannel
  namespace: kube-flannel
---
apiVersion: v1
kind: ServiceAccount
metadata:
  labels:
    k8s-app: flannel
  name: flannel
  namespace: kube-flannel
---
kind: ConfigMap
apiVersion: v1
metadata:
  name: kube-flannel-cfg
  namespace: kube-flannel
  labels:
    tier: node
    k8s-app: flannel
    app: flannel
data:
  cni-conf.json: |
    {
      "name": "cbr0",
      "cniVersion": "0.3.1",
      "plugins": [
        {
          "type": "flannel",
          "delegate": {
            "hairpinMode": true,
            "isDefaultGateway": true
          }
        },
        {
          "type": "portmap",
          "capabilities": {
            "portMappings": true
          }
        }
      ]
    }
  net-conf.json: |
    {
      "Network": "10.244.0.0/16",
      "EnableNFTables": false,
      "Backend": {
        "Type": "vxlan"
      }
    }
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds
  namespace: kube-flannel
  labels:
    tier: node
    app: flannel
    k8s-app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      affinity:
        nodeAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
            nodeSelectorTerms:
            - matchExpressions:
              - key: kubernetes.io/os
                operator: In
                values:
                - linux
      hostNetwork: true
      priorityClassName: system-node-critical
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni-plugin
        image: ghcr.io/flannel-io/flannel-cni-plugin:v1.6.2-flannel1
        command:
        - cp
        args:
        - -f
        - /flannel
        - /opt/cni/bin/flannel
        volumeMounts:
        - name: cni-plugin
          mountPath: /opt/cni/bin
      - name: install-cni
        image: ghcr.io/flannel-io/flannel:v0.26.4
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
        image: ghcr.io/flannel-io/flannel:v0.26.4
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
            add: ["NET_ADMIN", "NET_RAW"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        - name: EVENT_QUEUE_DEPTH
          value: "5000"
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
        - name: xtables-lock
          mountPath: /run/xtables.lock
      volumes:
      - name: run
        hostPath:
          path: /run/flannel
      - name: cni-plugin
        hostPath:
          path: /opt/cni/bin
      - name: cni
        hostPath:
          path: /etc/cni/net.d
      - name: flannel-cfg
        configMap:
          name: kube-flannel-cfg
      - name: xtables-lock
        hostPath:
          path: /run/xtables.lock
          type: FileOrCreate

检查节点状态

安装 Flannel 网络插件后,节点状态为Ready

# 查看节点状态
kubectl get nodes

查询其他状态

# 查看所有命名空间中的 Pod 状态
kubectl get pods -A
# 查看控制平面组件的状态
kubectl get cs

至此,一个基本的 Kubernetes 集群已经成功搭建,并且可以开始部署应用了。

正文到此结束