SpringBoot接入Prometheus+Grafana监控资源

简单介绍

Prometheus 是一个开源的监控和报警系统,专为容器化和微服务架构设计。它通过拉取(Pull)模式定期从应用程序或系统的指标端点(通常是 HTTP 接口)抓取时间序列数据。数据以时间戳+指标名称+标签的形式存储,支持高效查询和聚合。Prometheus 使用 PromQL(Prometheus 查询语言)来查询、聚合和展示数据。

Prometheus 提供强大的告警机制,通过定义规则,在数据满足特定条件时触发告警。告警规则根据预设的时间间隔进行评估,并将告警信息发送到告警管理系统(如 Alertmanager)。

Prometheus 自带内存存储引擎,支持按时间范围自动删除过期数据。它还支持通过Push Gateway接收推送数据,以及与其他系统集成(如 Grafana)进行可视化展示。总体来说,Prometheus 的设计强调高效、可扩展、灵活,适合动态环境下的实时监控。

img

(图源自网络)

docker-compose 安装promethus+Grafana

已安装可忽略

  • 编辑prometheus配置文件

    /prometheus/prometheus.yml

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    # 全局配置
    global:
    # 设置抓取目标的默认时间间隔,表示 Prometheus 每 15 秒抓取一次目标数据
    scrape_interval: 15s
    # 设置评估规则的默认时间间隔,表示 Prometheus 每 15 秒评估一次告警规则
    evaluation_interval: 15s
    # 默认抓取超时设置为10秒
    # scrape_timeout is set to the global default (10s).

    # 告警配置
    alerting:
    # 配置告警管理器,指定告警接收的目标地址
    alertmanagers:
    - static_configs:
    # 告警接收地址,Prometheus 会将告警信息发送到此地址
    - targets: ['127.0.0.1:9093']

    # 加载规则文件,并根据全局“评估间隔”定期评估规则
    rule_files:
    # 指定规则文件的位置
    - "/etc/prometheus/rules.yml"

    # 控制 Prometheus 监控哪些资源
    # 默认配置中,Prometheus 会配置一个名为 'prometheus' 的作业,该作业用于抓取 Prometheus 服务器本身公开的时间序列数据
    scrape_configs:
    # 作业名称会作为标签“job=<job_name>`添加到此配置中获取的任何数据
    - job_name: 'prometheus'
    # 静态配置,指定 Prometheus 要抓取的目标地址
    static_configs:
    # 目标地址,Prometheus 会从此地址抓取数据(通常是 Prometheus 自己暴露的指标)
    - targets: ['localhost:9090']

    - job_name: 'node'
    # 静态配置,指定 Prometheus 要抓取的目标地址
    static_configs:
    # 目标地址,Prometheus 会从此地址抓取数据(通常是 Node Exporter)
    - targets: ['localhost:9100']
    # 为此目标添加标签,用于标识环境和角色
    labels:
    env: dev
    role: docker

    - job_name: 'prometheusapp'
    # 设置自定义的 metrics 路径,告诉 Prometheus 从哪里抓取应用程序的指标数据
    metrics_path: '/actuator/prometheus'
    static_configs:
    # 目标地址,Prometheus 会从该地址抓取 Prometheus 应用程序的指标数据
    - targets: ['host.docker.internal:8080']

  • 编辑告警规则文件

    /prometheus/rules.yml

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    groups:
    - name: example
    rules:
    # Alert for any instance that is unreachable for >5 minutes.
    - alert: InstanceDown
    expr: up == 0
    for: 1m
    labels:
    serverity: page
    annotations:
    summary: "Instance {{ $labels.instance }} down"
    description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 minutes."
  • 编辑告警配置文件

    /alertmanager/alertmanager.yml

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    global:
    resolve_timeout: 5m
    smtp_smarthost: 'xxx@xxx:587'
    smtp_from: 'zhaoysz@xxx'
    smtp_auth_username: 'xxx@xxx'
    smtp_auth_password: 'xxxx'
    smtp_require_tls: true
    route:
    group_by: ['alertname']
    group_wait: 10s
    group_interval: 10s
    repeat_interval: 1h
    receiver: 'test-mails'
    receivers:
    - name: 'test-mails'
    email_configs:
    - to: 'xxxxxx@qq.com'
  • 编辑docker-compose

    docker-compose.yml

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    version: '3.8'

    services:
    prometheus:
    image: prom/prometheus
    ports:
    - 9090:9090
    volumes:
    - /prometheus/:/etc/prometheus/
    - prometheus_data:/prometheus
    command:
    - '--config.file=/etc/prometheus/prometheus.yml'
    - '--storage.tsdb.path=/prometheus'
    - '--web.external-url=http://prometheus:9090/'
    - '--web.enable-lifecycle'
    networks:
    - monitor_net
    restart: always

    alertmanager:
    image: prom/alertmanager
    volumes:
    - /alertmanager/:/etc/alertmanager/
    - alertmanager_data:/alertmanager
    ports:
    - 9093:9093
    command:
    - '--config.file=/etc/alertmanager/alertmanager.yml'
    - '--storage.path=/alertmanager'
    networks:
    - monitor_net
    restart: always

    grafana:
    image: grafana/grafana
    ports:
    - 3000:3000
    volumes:
    - /grafana/:/etc/grafana/provisioning/
    - grafana_data:/var/lib/grafana
    environment:
    - GF_INSTALL_PLUGINS=camptocamp-prometheus-alertmanager-datasource
    depends_on:
    - prometheus
    - alertmanager
    networks:
    - monitor_net
    restart: always

    volumes:
    prometheus_data: {}
    grafana_data: {}
    alertmanager_data: {}

    networks:
    monitor_net:
    driver: bridge
  • 启动composer

    1
    docker-compose -f docker-compose.yml up -d

    image-20250224113243071

    关闭命令:docker-compose -f docker-compose.yml down

  • 访问端点
    http://localhost:9090 Prometheus server主页
    http://localhost:9090/metrics Prometheus server自身指标
    http://localhost:3000 Grafana

  • 配置Grafana

    访问http://localhost:3000/,初始登录账号/密码: admin/admin

    创建Prometheus数据源
    左侧菜单Connection -> Data sources -> Add data source
    选择“ Prometheus”作为类型。
    设置适当的Prometheus服务器网址(例如,http://prometheus:9090/)
    image-20250224105335976image-20250224105319683

Springboot集成promethus

  • pom.xml 添加以下dependency

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    <!-- Spring Boot Actuator -->
    <dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
    <version>2.7.15</version>
    </dependency>
    <!-- Micrometer Prometheus Registry -->
    <dependency>
    <groupId>io.micrometer</groupId>
    <artifactId>micrometer-registry-prometheus</artifactId>
    <version>1.9.14</version>
    </dependency>
  • application.yml

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    management:
    # 配置 Spring Boot 的管理端点(如健康检查、指标等)
    endpoints:
    # 配置管理端点的 web 相关暴露设置
    web:
    # 设置暴露的端点,'include: *' 表示暴露所有管理端点
    exposure:
    include: '*'

    # 配置 Spring Boot 的指标收集和导出设置
    metrics:
    # 配置 Prometheus 导出设置
    export:
    prometheus:
    # 启用 Prometheus 数据导出功能,允许 Prometheus 从 Spring Boot 应用中抓取指标
    enabled: true

    # 设置 Spring Boot 应用的标签信息
    tags:
    # 为导出的 Prometheus 数据添加标签,这里使用应用程序的名称作为标签值
    application: '${spring.application.name}'
  • 启动Springboot应用

    访问http://localhost:8080/actuator/prometheus

    image-20250224105134383

  • 自定义监控指标

    1
    2
    3
    4
    5
    6
    7
    @Resource
    MeterRegistry meterRegistry;

    @RequestMapping(value = "/", method = RequestMethod.GET)
    public void hello() {
    meterRegistry.counter("requests_count").increment();
    }
  • 监控指标+制作Grafana看板

    image-20250224105241055image-20250224105303039


SpringBoot接入Prometheus+Grafana监控资源
https://cason.work/2025/02/24/SpringBoot接入Prometheus-Grafana监控资源/
作者
Cason Mo
发布于
2025年2月24日
许可协议