管理节点操作系统盘容量使用过高,发现是云平台监控服务prometheus产生的监控数据较大导致。
云平台环境:ZStack Cloud4.2.2
管理节点:双管理节点高可用
存储环境:本地存储
网络环境:公有网络
ZStack支持Prometheus,用于数据监控相关功能。提供两个版本Prometheus的支持,根据ZStack支持程度不同,如下:
Prometheus-1.8.2:ZStack所有版本支持。
Prometheus-2.9.2:ZStack 3.5.0版本及以后版本支持,在系统稳定性、资源使用优化,以及功能性方面都有很大的提升。
ZStack版本升级应该注意以下情况:
ZStack 3.5.0之前版本升级到ZStack 3.5.0及之后版本,默认继续使用Prometheus-1.8.2。
ZStack 3.5.0及之后版本,升级后Prometheus继承原来版本。
初装ZStack 3.5.0及之后版本,默认使用Prometheus-2.9.2。
列举出如下场景,请自行参考修改即可,本次参考场景一
场景一:版本切换
ZStack 3.5.0及之后版本同时支持两个版本的Prometheus,可通过如下方法进行版本切换:
依次执行如下命令,将Prometheus-1.8.2切换为Prometheus-2.9.2:
[root@localhost ~]# zstack-ctl configure Prometheus.versionMode=2.x [root@localhost ~]# zstack-ctl restart_node
场景二:版本兼容
ZStack 3.5.0之前版本升级到ZStack 3.5.0及之后版本,再启用Prometheus-2.9.2将导致旧的监控无法显示。若启用Prometheus-2.9.2的同时保证旧的监控数据依旧生效,请依次执行如下命令:
[root@localhost ~]# zstack-ctl configure Prometheus.versionMode=2.x-compatible [root@localhost ~]# zstack-ctl restart_node
场景三:回退操作
依次执行如下命令,将Prometheus-2.9.2切换为Prometheus-1.8.2:
[root@localhost ~]# zstack-ctl configure Prometheus.versionMode=1.8.2 [root@localhost ~]# zstack-ctl restart_node
场景四:禁用监控
如果不需要监控可停用Prometheus监控:
依次执行如下命令,禁用Prometheus,禁用后监控数据不可用:
[root@localhost ~]# zstack-ctl configure Prometheus.versionMode=none [root@localhost ~]# zstack-ctl restart_node
(注意事项)
1、3.5.0及之前版本升级到3.5.0版本之上,升级完成后可能发生管理节点服务异常现象,原因是旧的prometheus1服务还在持续运行,需要将旧的prometheus服务给停掉,执行kill -15 来关闭相关prometheus1服务进程。
(图1 管理节点升级异常)
(图2 停止prometheus1服务进程)
2、再次重启管理节点服务和prometheus服务,进入/var/lib/zstack/prometheus/目录下,发现data变成data2,说明prometheus已经升级成功,管理节点对监控数据的管控也更加稳定
(图3 Prometheus升级完成)