跳到主要内容

Redis 集群扩缩容

KubeBlocks 支持对 Redis 集群进行垂直扩缩容和水平扩缩容。

垂直扩缩容

你可以通过更改资源需求和限制(CPU 和存储)来垂直扩展集群。例如,可通过垂直扩容将资源类别从 1C2G 调整为 2C4G。

开始之前

确保集群处于 Running 状态,否则以下操作可能会失败。

kbcli cluster list <name>

示例

kbcli cluster list redis-cluster
>
NAME NAMESPACE CLUSTER-DEFINITION VERSION TERMINATION-POLICY STATUS CREATED-TIME
redis-cluster default redis redis-7.0.6 Delete Running Apr 10,2023 16:21 UTC+0800

步骤

  1. 更改配置。

    配置参数 --components--memory--cpu,并执行以下命令。

    kbcli cluster vscale redis-cluster \
    --components="redis" \
    --memory="4Gi" --cpu="2" \
    • --components 表示可进行垂直扩容的组件名称。
    • --memory 表示组件请求和限制的内存大小。
    • --cpu 表示组件请求和限制的CPU大小。
  2. 验证垂直扩容。

    执行以下命令检查集群状态,验证垂直扩缩容。

    kbcli cluster list redis-cluster
    >
    NAME NAMESPACE CLUSTER-DEFINITION VERSION TERMINATION-POLICY STATUS CREATED-TIME
    redis-cluster default redis redis-7.0.6 Delete VerticalScaling Apr 10,2023 16:27 UTC+0800
    • STATUS=VerticalScaling 表示正在进行垂直扩容。

    • STATUS=Running 表示垂直扩容已完成。

    • STATUS=Abnormal 表示垂直扩容异常。原因可能是正常实例的数量少于总实例数,或者 Leader 实例正常运行而其他实例异常。

      你可以手动检查是否由于资源不足而导致报错。如果 Kubernetes 集群支持 AutoScaling,系统在资源充足的情况下会执行自动恢复。或者你也可以创建足够的资源,并使用 kubectl describe 命令进行故障排除。

      备注

      垂直扩容不会同步与 CPU 和内存相关的参数,需要手动调用配置的 OpsRequest 来进行更改。详情请参考配置

  3. 检查资源规格是否已变更。

    kbcli cluster describe redis-cluster

水平扩缩容

水平扩缩容会改变 Pod 的数量。例如,你可以应用水平扩容将 Pod 的数量从三个增加到五个。扩容过程包括数据的备份和恢复。

从 v0.9.0 开始,KubeBlocks 支持指定实例水平扩缩容,可参考 API 文档,查看详细介绍及示例。

开始之前

确保集群处于 Running 状态,否则以下操作可能会失败。

kbcli cluster list redis-cluster
>
NAME NAMESPACE CLUSTER-DEFINITION VERSION TERMINATION-POLICY STATUS CREATED-TIME
redis-cluster default redis redis-7.0.6 Delete Running Apr 10,2023 16:50 UTC+0800

步骤

  1. 更改配置。

    配置参数 --components--replicas,并执行以下命令。

    示例

    kbcli cluster hscale redis-cluster \
    --components="redis" --replicas=2
    • --components 表示准备进行水平扩容的组件名称。
    • --replicas 表示指定组件的副本数。
  2. 验证水平扩容。

    检查集群状态,确定水平扩容的情况。

    kbcli cluster list redis-cluster
    >
    NAME NAMESPACE CLUSTER-DEFINITION VERSION TERMINATION-POLICY STATUS CREATED-TIME
    redis-cluster default redis redis-7.0.6 Delete Updating Apr 10,2023 16:58 UTC+0800
    • STATUS=Updating 表示正在进行水平扩容。
    • STATUS=Running 表示水平扩容已完成。

处理快照异常

如果在水平扩容过程中出现 STATUS=ConditionsError,你可以从 cluster.status.condition.message 中找到原因并进行故障排除。如下所示,该例子中发生了快照异常。

Status:
conditions:
- lastTransitionTime: "2023-04-10T18:20:26Z"
message: VolumeSnapshot/redis-cluster-redis-scaling-dbqgp: Failed to set default snapshot
class with error cannot find default snapshot class
reason: ApplyResourcesFailed
status: "False"
type: ApplyResources

原因

此异常发生的原因是未配置 VolumeSnapshotClass。可以通过配置 VolumeSnapshotClass 解决问题。

但此时,水平扩容仍然无法继续运行。这是因为错误的备份(volumesnapshot 由备份生成)和之前生成的 volumesnapshot 仍然存在。需删除这两个错误的资源,KubeBlocks 才能重新生成新的资源。

步骤:

  1. 配置 VolumeSnapshotClass。

    kubectl create -f - <<EOF
    apiVersion: snapshot.storage.k8s.io/v1
    kind: VolumeSnapshotClass
    metadata:
    name: csi-aws-vsc
    annotations:
    snapshot.storage.kubernetes.io/is-default-class: "true"
    driver: ebs.csi.aws.com
    deletionPolicy: Delete
    EOF
  2. 删除错误的备份(volumesnapshot 由备份生成)和 volumesnapshot 资源。

    kubectl delete backup -l app.kubernetes.io/instance=redis-cluster

    kubectl delete volumesnapshot -l app.kubernetes.io/instance=redis-cluster

结果

删除备份和 volumesnapshot 后,水平扩容继续进行,集群恢复到 Running 状态。