Doris环境监控(二)
Doris采用Prometheus and Grafana 来采集和监控展示相关的指标
参考文档
https://doris.apache.org/docs/admin-manual/maint-monitor/monitor-alert/
一。搭建Prometheus环境
[root@node1 ~]# tar -zxvf prometheus-2.43.0.linux-amd64.tar.gz -C /opt/
配置 Prometheus
在 prometheus.yml 中添加 StarRocks 监控相关的配置。# my global config
global:
scrape_interval: 15s # 全局的采集间隔,默认是 1m,这里设置为 15s
evaluation_interval: 15s # 全局的规则触发间隔,默认是 1m,这里设置 15s
scrape_configs:
# The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
– job_name: ‘StarRocks_Cluster01’ # 每一个集群称之为一个job,可以自定义名字作为StarRocks集群名
metrics_path: ‘/metrics’ # 指定获取监控项目的Restful Api
static_configs:
– targets: [‘fe_host1:http_port’,’fe_host3:http_port’,’fe_host3:http_port‘]
labels:
group: fe # 这里配置了 fe 的 group,该 group 中包含了 3 个 Frontends
– targets: [‘be_host1:webserver_port’, ‘be_host2:webserver_port’, ‘be_host3:webserver_port‘]
labels:
group: be # 这里配置了 be 的 group,该 group 中包含了 3 个 Backends
备注:Doris相关的环境端口,http_port默认为:8031;webserver_port默认为:8041。可以通过show frontends命令获取。
启动 Prometheus
通过以下命令启动 Prometheus。
nohup ./prometheus \
–config.file=”./prometheus.yml” \
–web.listen-address=”:9090″ \
–log.level=”info” &
该命令将后台运行 Prometheus,并指定其 Web 端口为 9090
。启动后,即开始采集数据,并将数据存放在 ./data 目录中。
访问 Prometheus
您可以通过 Web 页面访问 Prometheus。通过浏览器打开 9090
端口,即可访问 Prometheus 的页面。依次点击导航栏中 Status 和 Targets,即可看到所有分组 Job 的监控主机节点。正常情况下,所有节点都应为 UP,表示数据采集正常。如果节点状态不为 UP,您可以访问 StarRocks 的 Metrics 接口(http://fe_host:fe_http_port/metrics
或 http://be_host:be_http_port/metrics
)检查是否可以访问。如果仍无法解决,您可以查询 Prometheus 相关文档寻找解决方案。

至此,一个简单的 Prometheus 已经搭建、配置完毕。
二、grafana环境搭建
[root@node1 ~]# tar -zxvf grafana-enterprise-8.5.22.linux-amd64.tar.gz -C /opt/
配置 Grafana
在 ./conf/defaults.ini 中添加相关的配置。 …
[paths]
data = ./data
logs = ./data/log
plugins = ./data/plugins
[server]
http_port = 8000
domain = localhost
…
启动 Grafana
通过以下命令启动 Grafana。 nohup ./bin/grafana-server \
–config=”./conf/defaults.ini” &
配置 DashBoard
通过先前配置的地址(http://grafana_host:8000
)登录 Grafana,默认用户名为 admin
,密码为 admin
。
1. 配置数据源。
依次点击 Configuration,Data sources,Add data source,和 Prometheus。
Data Source 配置项简介

- Name: 数据源的名称,自定义,比如
starrocks_monitor
- URL: Prometheus 的 web 地址,如
http://prometheus_host:9090
- Access: 选择 Server 方式,即通过 Grafana 进程所在服务器,访问 Prometheus。
其他配置项可使用默认设置。
点击最下方 Save & Test 保存配置,如果显示 Data source is working,即表示数据源可用。
导入模板

三、安装完毕之后验证
导入模板之后

监控2
