Pulsar 集群扩缩容
KubeBlocks 支持对 Pulsar 集群进行垂直和水平扩缩容。
垂直扩缩容
您可以通过更改资源需求和限制(例如 CPU 和存储)来实现集群垂直扩缩容。例如,您可以通过垂直扩缩容将资源类别从 1C2G 更改为 2C4G。
开始之前
检查集群状态是否为 Running
。否则,后续操作可能会失败。
kubectl get cluster mycluster -n demo
步骤
可通过以下两种方式实现垂直扩缩容。
- OpsRequest
- 编辑集群 YAML 文件
对指定的集群应用 OpsRequest,可根据您的需求配置参数。
kubectl create -f -<< EOF
apiVersion: apps.kubeblocks.io/v1alpha1
kind: OpsRequest
metadata:
name: ops-vscale
namespace: demo
spec:
clusterName: mycluster
type: VerticalScaling
verticalScaling:
- componentName: pulsar-broker
requests:
memory: "10Gi"
cpu: 3
limits:
memory: "10Gi"
cpu: 3
- componentName: bookies
requests:
memory: "10Gi"
cpu: 3
limits:
memory: "10Gi"
cpu: 3
EOF查看运维任务状态,验证垂直扩缩容操作是否成功。
kubectl get ops -n demo
>
NAMESPACE NAME TYPE CLUSTER STATUS PROGRESS AGE
demo ops-vertical-scaling VerticalScaling mycluster Succeed 3/3 6m如果有报错,可执行
kubectl describe ops -n demo
命令查看该运维操作的相关事件,协助排障。查看相应资源是否变更。
kubectl describe cluster mycluster -n demo
修改 YAML 文件中
spec.componentSpecs.resources
的配置。spec.componentSpecs.resources
控制资源的请求值和限制值,修改参数值将触发垂直扩缩容。kubectl edit cluster mycluster -n demo
>
......
spec:
affinity:
podAntiAffinity: Preferred
topologyKeys:
- kubernetes.io/hostname
clusterDefinitionRef: pulsar
clusterVersionRef: pulsar-3.0.2
componentSpecs:
- componentDefRef: pulsar
enabledLogs:
- running
disableExporter: true
name: pulsar
replicas: 1
resources:
limits:
cpu: "2"
memory: 4Gi
requests:
cpu: "1"
memory: 2Gi查看相应资源是否变更。
kubectl describe cluster mycluster -n demo
>
......
Component Specs:
Component Def Ref: pulsar
Enabled Logs:
running
DisableExporter: true
Name: pulsar
Replicas: 1
Resources:
Limits:
Cpu: 2
Memory: 4Gi
Requests:
Cpu: 1
Memory: 2Gi
水平扩缩容
水平扩展改变 Pod 的数量。例如,您可以将副本从三个扩展到五个。
从 v0.9.0 开始,除了支持副本(replica)的扩缩容外,KubeBlocks 还支持了实例(instance)的扩缩容。可通过 水平扩缩容 文档了解更多细节和示例。
开始之前
Zookeeper 建议固定 3 节点,无需扩缩容,其他可以针对多个或单个组件进行水平扩缩容。
谨慎扩缩容 Bookies 节点。其数据复制与 EnsembleSize、Write Quorum 和 Ack Quorum 配置有关,扩缩容可能导致数据丢失。详细信息请查阅 Pulsar 官方文档。
确保集群处于
Running
状态,否则以下操作可能会失败。kubectl get cluster mycluster -n demo
>
NAME CLUSTER-DEFINITION VERSION TERMINATION-POLICY STATUS AGE
mycluster pulsar pulsar-3.0.2 Delete Running 47m
步骤
可通过以下两种方式实现水平扩缩容。
- OpsRequest
- 编辑集群 YAML 文件
对指定的集群应用 OpsRequest,可根据您的需求配置参数。
以下示例演示了增加 2 个副本。
kubectl create -f -<< EOF
apiVersion: apps.kubeblocks.io/v1alpha1
kind: OpsRequest
metadata:
name: ops-horizontalscaling
namespace: demo
spec:
clusterRef: mycluster
type: HorizontalScaling
horizontalScaling:
- componentName: pulsar-proxy
scaleOut:
replicaChanges: 2
EOF如果您想要缩容,可将
scaleOut
替换为scaleIn
。以下示例演示了删除 2 个副本。
kubectl create -f -<< EOF
apiVersion: apps.kubeblocks.io/v1alpha1
kind: OpsRequest
metadata:
name: ops-horizontalscaling
namespace: demo
spec:
clusterRef: mycluster
type: HorizontalScaling
horizontalScaling:
- componentName: pulsar-proxy
scaleIn:
replicaChanges: 2
EOF查看运维任务状态,验证垂直扩缩容操作是否成功。
kubectl get ops -n demo
>
NAMESPACE NAME TYPE CLUSTER STATUS PROGRESS AGE
demo ops-horizontal-scaling HorizontalScaling mycluster Succeed 3/3 6m如果有报错,可执行
kubectl describe ops -n demo
命令查看该运维操作的相关事件,协助排障。查看相应资源是否变更。
kubectl describe cluster mycluster -n demo
修改 YAML 文件中
spec.componentSpecs.replicas
的配置。spec.componentSpecs.replicas
定义了 pod 数量,修改该参数将触发集群水平扩缩容。kubectl edit cluster mycluster -n demo
>
apiVersion: apps.kubeblocks.io/v1alpha1
kind: Cluster
metadata:
name: mycluster
namespace: demo
spec:
clusterDefinitionRef: pulsar
clusterVersionRef: pulsar-3.0.2
componentSpecs:
- name: pulsar
componentDefRef: pulsar-proxy
replicas: 2 # 修改该参数值查看相关资源是否变更。
kubectl describe cluster mycluster -n demo
处理快照异常
如果在水平扩容过程中出现 STATUS=ConditionsError
,你可以从 cluster.status.condition.message
中找到原因并进行故障排除。如下所示,该例子中发生了快照异常。
Status:
conditions:
- lastTransitionTime: "2023-02-08T04:20:26Z"
message: VolumeSnapshot/mycluster-pulsar-scaling-dbqgp: Failed to set default snapshot
class with error cannot find default snapshot class
reason: ApplyResourcesFailed
status: "False"
type: ApplyResources
原因
此异常发生的原因是未配置 VolumeSnapshotClass
。可以通过配置 VolumeSnapshotClass
解决问题。
但此时,水平扩容仍然无法继续运行。这是因为错误的备份(volumesnapshot 由备份生成)和之前生成的 volumesnapshot 仍然存在。需删除这两个错误的资源,KubeBlocks 才能重新生成新的资源。
步骤:
配置 VolumeSnapshotClass。
kubectl create -f - <<EOF
apiVersion: snapshot.storage.k8s.io/v1
kind: VolumeSnapshotClass
metadata:
name: csi-aws-vsc
annotations:
snapshot.storage.kubernetes.io/is-default-class: "true"
driver: ebs.csi.aws.com
deletionPolicy: Delete
EOF删除错误的备份和 volumesnapshot 资源。
kubectl delete backup -l app.kubernetes.io/instance=mysql-cluster
kubectl delete volumesnapshot -l app.kubernetes.io/instance=mysql-cluster
结果
删除备份和 volumesnapshot 后,水平扩容继续进行,集群恢复到 Running
状态。