动态资源调度

动态资源调度(Distributed Resource Scheduler,简称DRS):以集群为单位监控物理机CPU或内存负载情况,根据配置的调度策略,动态调整物理机上运行的云主机业务。

云平台支持手动和自动两种调度策略:手动调度策略提供调度建议,用户可按照调度建议手动迁移云主机。自动调度策略,由系统根据调度算法自动执行资源调度。两种调度策略均可平衡集群负载,且有效提高云平台稳定性。

使用动态资源调度的基本流程:
  1. 打开动态资源调度开关。
  2. 配置动态资源调度策略。
  3. 执行动态资源调度相关操作。

打开动态资源调度开关

集群动态资源调度开关默认打开,若用户关闭该开关,重新打开时需确保:
  • 集群内仅存在Ceph、Shared Block类型的主存储。
  • 集群内所有物理机CPU型号一致。
  • 集群内不存在已经绑定亲和组的云主机。
当以上条件全部满足,进入集群详情页的高级设置子页面,将动态资源调度开关开启,随后即可前往动态资源调度页面配置调度策略,配置策略完成后动态资源调度功能生效
Figure 1所示:
Figure 1. 自动动态资源调度


Note: 使用动态资源调度功能,需注意:
  • 动态资源调度功能开启后,不允许将集群内云主机加入亲和组。
  • 若动态资源调度运行过程添加Ceph、Shared Block以外的主存储或添加CPU型号不一致的物理机,将导致动态资源调度无法正常工作。
  • 动态资源调度功能关闭后,继续保留调度策略相关配置,重新打开即可生效,支持点击修改配置按钮重新配置调度策略。

配置动态资源调度策略

首次打开动态资源调度功能后,在动态资源调度页面,点击立即配置按钮,跳转到配置动态资源调度策略页面。

可参考以下示例输入相应内容:
  • 资源种类:默认为计算资源,暂不支持修改
  • 调度模式:支持手动和自动两种调度模式:
    • 手动调度:集群内物理机CPU使用率或内存使用率达到指定阈值后,用户手动根据调度建议执行资源调度。
    • 自动调度:集群内物理机CPU使用率或内存使用率达到指定阈值后,系统根据调度算法自动执行资源调度。
  • 监控条目:选择物理机监控条目,包括:CPU使用率、内存使用率、CPU或内存使用率
    • CPU使用率:自定义CPU使用率监控条目触发条件
    • 内存使用率:自定义内存使用率监控条目触发条件
  • 持续时间:自定义阈值持续时间,单位包括:秒、分钟、小时
Note: 集群内任一物理机达到监控条目触发条件阈值并满足持续时间,即可判定集群状态不平衡,将给出调度建议。
Figure 2所示:
Figure 2. 配置自动动态资源调度策略


执行动态资源调度相关操作

动态资源调度支持以下操作:
  • 平衡状态扫描:手动扫描集群平衡状态。
    Note:
    • 系统基于默认扫描周期(默认10分钟)自动扫描集群平衡状态。
    • 用户可自行设置扫描周期。设置方法:

      进入设置 > 平台设置 > 全局设置 > 高级设置 > 平台策略 > 动态资源调度,设置DRS集群扫描间隔即可,默认为600秒(即:10分钟)。

  • 修改配置:修改动态资源调度策略相关配置,支持修改监控条目、触发条件和持续时间。
  • 执行调度:按照调度建议,将云主机迁移至推荐的物理机,平衡集群负载。
    Note:
    • 仅当设置为手动资源调度策略时支持该操作。
    • 执行资源调度支持设置云主机迁移并发度,仅适用动态资源调度场景。设置方法:

      进入设置 > 平台设置 > 全局设置 > 高级设置 > 平台策略 > 动态资源调度,设置DRS云主机迁移并发度即可,默认为1,表示同一时刻允许云主机从当前所在物理机迁移至建议目标物理机的最大数量为1台。

  • 查看执行历史:查看调度执行历史、执行结果、执行时间等信息,默认查看近7天数据。支持自定义时间段查看执行历史;支持按云主机UUID搜索执行历史。