SpringBoot接入Prometheus+Grafana监控资源
简单介绍
Prometheus 是一个开源的监控和报警系统,专为容器化和微服务架构设计。它通过拉取(Pull)模式定期从应用程序或系统的指标端点(通常是 HTTP 接口)抓取时间序列数据。数据以时间戳+指标名称+标签的形式存储,支持高效查询和聚合。Prometheus 使用 PromQL(Prometheus 查询语言)来查询、聚合和展示数据。
Prometheus 提供强大的告警机制,通过定义规则,在数据满足特定条件时触发告警。告警规则根据预设的时间间隔进行评估,并将告警信息发送到告警管理系统(如 Alertmanager)。
Prometheus 自带内存存储引擎,支持按时间范围自动删除过期数据。它还支持通过Push Gateway接收推送数据,以及与其他系统集成(如 Grafana)进行可视化展示。总体来说,Prometheus 的设计强调高效、可扩展、灵活,适合动态环境下的实时监控。
docker-compose 安装promethus+Grafana
已安装可忽略
编辑prometheus配置文件
/prometheus/prometheus.yml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49# 全局配置
global:
# 设置抓取目标的默认时间间隔,表示 Prometheus 每 15 秒抓取一次目标数据
scrape_interval: 15s
# 设置评估规则的默认时间间隔,表示 Prometheus 每 15 秒评估一次告警规则
evaluation_interval: 15s
# 默认抓取超时设置为10秒
# scrape_timeout is set to the global default (10s).
# 告警配置
alerting:
# 配置告警管理器,指定告警接收的目标地址
alertmanagers:
- static_configs:
# 告警接收地址,Prometheus 会将告警信息发送到此地址
- targets: ['127.0.0.1:9093']
# 加载规则文件,并根据全局“评估间隔”定期评估规则
rule_files:
# 指定规则文件的位置
- "/etc/prometheus/rules.yml"
# 控制 Prometheus 监控哪些资源
# 默认配置中,Prometheus 会配置一个名为 'prometheus' 的作业,该作业用于抓取 Prometheus 服务器本身公开的时间序列数据
scrape_configs:
# 作业名称会作为标签“job=<job_name>`添加到此配置中获取的任何数据
- job_name: 'prometheus'
# 静态配置,指定 Prometheus 要抓取的目标地址
static_configs:
# 目标地址,Prometheus 会从此地址抓取数据(通常是 Prometheus 自己暴露的指标)
- targets: ['localhost:9090']
- job_name: 'node'
# 静态配置,指定 Prometheus 要抓取的目标地址
static_configs:
# 目标地址,Prometheus 会从此地址抓取数据(通常是 Node Exporter)
- targets: ['localhost:9100']
# 为此目标添加标签,用于标识环境和角色
labels:
env: dev
role: docker
- job_name: 'prometheusapp'
# 设置自定义的 metrics 路径,告诉 Prometheus 从哪里抓取应用程序的指标数据
metrics_path: '/actuator/prometheus'
static_configs:
# 目标地址,Prometheus 会从该地址抓取 Prometheus 应用程序的指标数据
- targets: ['host.docker.internal:8080']编辑告警规则文件
/prometheus/rules.yml
1
2
3
4
5
6
7
8
9
10
11
12groups:
- name: example
rules:
# Alert for any instance that is unreachable for >5 minutes.
- alert: InstanceDown
expr: up == 0
for: 1m
labels:
serverity: page
annotations:
summary: "Instance {{ $labels.instance }} down"
description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 minutes."编辑告警配置文件
/alertmanager/alertmanager.yml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17global:
resolve_timeout: 5m
smtp_smarthost: 'xxx@xxx:587'
smtp_from: 'zhaoysz@xxx'
smtp_auth_username: 'xxx@xxx'
smtp_auth_password: 'xxxx'
smtp_require_tls: true
route:
group_by: ['alertname']
group_wait: 10s
group_interval: 10s
repeat_interval: 1h
receiver: 'test-mails'
receivers:
- name: 'test-mails'
email_configs:
- to: 'xxxxxx@qq.com'编辑docker-compose
docker-compose.yml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57version: '3.8'
services:
prometheus:
image: prom/prometheus
ports:
- 9090:9090
volumes:
- /prometheus/:/etc/prometheus/
- prometheus_data:/prometheus
command:
- '--config.file=/etc/prometheus/prometheus.yml'
- '--storage.tsdb.path=/prometheus'
- '--web.external-url=http://prometheus:9090/'
- '--web.enable-lifecycle'
networks:
- monitor_net
restart: always
alertmanager:
image: prom/alertmanager
volumes:
- /alertmanager/:/etc/alertmanager/
- alertmanager_data:/alertmanager
ports:
- 9093:9093
command:
- '--config.file=/etc/alertmanager/alertmanager.yml'
- '--storage.path=/alertmanager'
networks:
- monitor_net
restart: always
grafana:
image: grafana/grafana
ports:
- 3000:3000
volumes:
- /grafana/:/etc/grafana/provisioning/
- grafana_data:/var/lib/grafana
environment:
- GF_INSTALL_PLUGINS=camptocamp-prometheus-alertmanager-datasource
depends_on:
- prometheus
- alertmanager
networks:
- monitor_net
restart: always
volumes:
prometheus_data: {}
grafana_data: {}
alertmanager_data: {}
networks:
monitor_net:
driver: bridge启动composer
1
docker-compose -f docker-compose.yml up -d
关闭命令:docker-compose -f docker-compose.yml down
访问端点
http://localhost:9090 Prometheus server主页
http://localhost:9090/metrics Prometheus server自身指标
http://localhost:3000 Grafana配置Grafana
访问http://localhost:3000/,初始登录账号/密码: admin/admin
创建Prometheus数据源
左侧菜单Connection -> Data sources -> Add data source
选择“ Prometheus”作为类型。
设置适当的Prometheus服务器网址(例如,http://prometheus:9090/)
Springboot集成promethus
pom.xml 添加以下dependency
1
2
3
4
5
6
7
8
9
10
11
12<!-- Spring Boot Actuator -->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
<version>2.7.15</version>
</dependency>
<!-- Micrometer Prometheus Registry -->
<dependency>
<groupId>io.micrometer</groupId>
<artifactId>micrometer-registry-prometheus</artifactId>
<version>1.9.14</version>
</dependency>application.yml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21management:
# 配置 Spring Boot 的管理端点(如健康检查、指标等)
endpoints:
# 配置管理端点的 web 相关暴露设置
web:
# 设置暴露的端点,'include: *' 表示暴露所有管理端点
exposure:
include: '*'
# 配置 Spring Boot 的指标收集和导出设置
metrics:
# 配置 Prometheus 导出设置
export:
prometheus:
# 启用 Prometheus 数据导出功能,允许 Prometheus 从 Spring Boot 应用中抓取指标
enabled: true
# 设置 Spring Boot 应用的标签信息
tags:
# 为导出的 Prometheus 数据添加标签,这里使用应用程序的名称作为标签值
application: '${spring.application.name}'启动Springboot应用
访问http://localhost:8080/actuator/prometheus
自定义监控指标
1
2
3
4
5
6
7@Resource
MeterRegistry meterRegistry;
@RequestMapping(value = "/", method = RequestMethod.GET)
public void hello() {
meterRegistry.counter("requests_count").increment();
}监控指标+制作Grafana看板