概述
弹性伸缩组:一组具有相同应用场景的云主机集合,可根据用户业务变化自动实现弹性伸缩或弹性自愈。
功能特点
- 弹性伸缩
- 弹性伸缩包括弹性扩容和弹性缩容,前者在业务增长时自动增加云主机,后者在业务下降时自动减少云主机。
- 提供监控报警触发弹性伸缩,可自定义接收端类型,包括系统/邮箱/钉钉/HTTP应用/短信/Microsoft Teams。
如Figure 1所示:Figure 1. 弹性伸缩
- 弹性自愈
- 弹性自愈通过监控伸缩组内云主机的健康状态,自动移除不健康云主机并创建新的云主机,确保组内健康云主机数不低于设置的最小值。
- 提供两种健康检查机制触发弹性自愈:负载均衡健康检查、云主机健康检查。若伸缩组配置了负载均衡功能,建议选择负载均衡器自带的健康检查机制。
如Figure 2所示:Figure 2. 弹性自愈
应用场景
以下介绍弹性伸缩组的三种典型应用场景:
- 弹性扩容:
某电商公司在双十一、春节等大型节日期间发起抢红包、秒杀等促销活动,负载激增,需及时、自动增加云主机进行扩容,避免访问延时和资源超负荷运行。
- 弹性缩容:
当节假日过后,该电商公司的业务负载明显回落,需及时、自动减少云主机进行缩容,避免资源浪费。
- 弹性自愈:
为保障该电商公司核心业务的正常运作,要求处于健康运行的云主机数量不能低于某个阈值。
补充说明
弹性扩容触发条件:
- 伸缩组内云主机负载超过阈值时触发弹性扩容
- 若伸缩组处于冷却时间内,则不执行弹性扩容。
- 若伸缩组内云主机数量已达上限,则不再新增云主机。
- 伸缩组内云主机的数量不会大于最大云主机数量。
- 伸缩组内云主机数量低于最小云主机数量时触发弹性扩容
- 若伸缩组内云主机数量已达上限,则不再新增云主机。
- 伸缩组内云主机的数量不会大于最大云主机数量。
弹性缩容触发条件:
- 伸缩组内云主机负载低于阈值时触发弹性缩容
- 若伸缩组处于冷却时间内,则不执行弹性缩容。
- 若伸缩组内云主机数量已达下限,则不再减少云主机。
- 伸缩组内云主机的数量不会小于最小云主机数量。
- 伸缩组内云主机数量高于最大云主机数量时触发弹性缩容
- 若伸缩组内云主机数量已达下限,则不再减少云主机。
- 伸缩组内云主机的数量不会小于最小云主机数量。
弹性自愈触发条件:云主机为不健康状态
- 云平台将删除不健康的云主机,若删除后伸缩组内云主机数量小于最小云主机数量,则执行弹性扩容策略,自动添加云主机。
关于弹性伸缩组,提供以下全局设置:
- 当伸缩组使用负载均衡健康检查机制时,可设置云主机在负载均衡中健康状态检查的时间间隔。
设置方法:进入
,设置负载均衡弹性伸缩组健康检查间隔即可,默认为10,单位为秒,最小值不能低于10秒,最大值不能高于1000秒。 - 当伸缩组使用负载均衡健康检查机制时,可设置云主机在负载均衡中健康状态检查的线程数。
设置方法:进入
,设置负载均衡弹性伸缩组健康检查线程数即可,默认为10,最小值不能低于10线程,最大值不能高于1000线程。 - 当伸缩组使用云主机健康检查机制时,可设置删除组内不健康云主机的时间间隔。
设置方法:进入
,设置组内不健康实例删除间隔即可,默认为30,单位为秒,最小值不能低于10秒,最大值不能高于1000秒。 - 当伸缩组使用云主机健康检查机制时,可设置删除组内不健康云主机的线程数。
设置方法:进入
,设置组内不健康实例删除线程数即可,默认为10,最小值不能低于10线程,最大值不能高于1000线程。 - 可设置伸缩组内云主机数量检查的时间间隔。
设置方法:进入
,设置组内实例数量检查间隔即可,默认为20,单位为秒,最小值不能低于10秒,最大值不能高于1000秒。
注意事项
- 若弹性伸缩组重复执行伸缩策略,如不断创建和删除云主机,可能为以下原因:
- 新创建的云主机无法在容忍时间内达到健康状态,云平台触发弹性自愈策略,删除不健康的云主机并重新创建,造成循环,需检查云主机健康检查策略或更改健康检查机制。
- 缩容阈值或扩容阈值设置不合理。例如:设置触发条件为CPU低于40%缩容,CPU高于45%扩容,若伸缩组只有一台云主机,组内云主机平均CPU负载为60%,触发扩容后增加至两台云主机,组内云主机平均CPU负载降为30%,造成循环,需设置扩容缩容策略至合理的阈值范围。
- 若伸缩组未执行伸缩策略,但不断触发报警,可能为以下原因:
- 最大云主机数量和扩容触发条件设置不合理,当伸缩组云主机数量已达上限,组内云主机平均负载仍然高于扩容阈值,则不断触发报警,需设置最大云主机数量和扩容触发条件至合理的阈值范围。
- 弹性伸缩组内云主机上运行的业务应用必须无状态并且可横向扩展。
- 弹性伸缩会自动释放云主机,建议不要对弹性伸缩组内云主机手动挂载云盘、网卡、安全组等。Note: 若组内云主机保存有状态信息,相关数据将会丢失。
- 弹性伸缩组无法纵向扩展,即:无法自动扩缩云主机的计算规格、网络带宽等配置。
- 若需要修改外部监控触发条目为内部监控使用条目,请删除弹性伸缩组并重新创建。