TiDB 多集群告警监控-中章-融合多集群 Grafana

news/2024/5/19 11:55:39 标签: tidb, grafana

作者: longzhuquan 原文来源: https://tidb.net/blog/ac730b0f

背景

随着公司XC改造步伐的前进,越来越多的业务选择 TiDB,由于各个业务之间需要物理隔离,避免不了的 TiDB 集群数量越来越多。虽然每套 TiDB 集群均有两个详细的监控 Dashboard、Grafana,但对于运维来说几十套集群的监控、告警、巡检均需消耗巨大的精力。上篇介绍了监控工具的安装,以及业务组如何规范的设置。本章着重介绍如何将多套集群 Grafana 数据统一管理。

监控大盘介绍

image.png

在夜莺仪表盘-监控仪表盘界面,通过预先配置好想要查看的图表,用户在未来查看时只需点击即可直接浏览一系列图表,无需逐一选择。例如,在 MySQL 监控中,资深 DBA 可以事先将重要的图表以及应关注的图表都配置到监控大盘中。详细介绍可参考 仪表盘 介绍。

先看看单张效果

怎么样是不是似曾相识?没错监控大屏可以适配TiDB的 Grafana,上一篇接入数据源之后,其实夜莺即可通过查询到所有普罗米修斯的数据,也可以将 TIDB 的监控数据全部查询。前提是在此页面进行 PromQL 的编写。

优雅的 COPY TiDB 监控

前面已经看到效果,但如果按照官方一个一个的图标的编辑,那把TiDB一套集群图标编辑完,估计也过年了。那有没有更方便的方式呢?

经过我司大量的实践,已经适配出了一套常用的监控数据,并且已经提交给夜莺官方,在最新企业版“仪表盘-内置仪表盘”可以看到 TIDB 监控模版。各位可直接使用。开源版暂时未放出,不过有兴趣的需要可私聊题主,或者在文章下留言,即可得到同款模版(由于文章限制 json 文件不太好进行附件)。

如得到文件后点击 仪表盘-监控仪表盘-对于业务组-批量导入-导入仪表盘 JSON 即可

image.png

导入完成后进入图表-点击修改按钮-选择tidb_datasource-取消隐藏变量-保存

即可在页面上自由选择数据源,选择完对应数据源(数据源与业务组一一对应)后建议在隐藏此变量,达到固定效果。

开源互相融合

上述方式过于复杂,并且没办法完美复刻 TiDB Grafana 监控项目。我们也观察到这点,目前正在与双方沟通协调此事,最终效果达到能将 TiDB 大盘完美展现在夜莺中。目前没办法直接展现原因由于双方的 grafana 版本不适配,后续可直接 COPY。不过目前也有一些进展,以其中一个大盘为例

点击保存-保存为文件-在通过上个章节的方式导入,即可实现完整复刻。不过目前仅仅支持几个特定的JSON模版。更多模版还需适配,当然如有强烈需求也可在文章留言反馈。我们可以尽量提供JSON模版。

image.png

image.png

image.png

成果展示

按照不同业务组区分不同集群

每个业务组拥有自己的大盘以及数据源

并且还可以将所有集群数据融合进同一个大盘,方便DBA监掌握百台机器资源使用情况。

结语

此篇介绍如何融合 Grafana ,目前看还存在一些适配性问题,但已经基本满足了需求。下篇将介绍如何补齐 TiDB 目前没有的监控指标,以及特殊需求的处理。


http://www.niftyadmin.cn/n/4952276.html

相关文章

CODE LLM 对比

CODE LLM ModelPass1License机构RespositoryCodeGen-16B-multi19.2开源SalesforceSalesforce/codegen-16B-multi at mainhttps://github.com/salesforce/CodeGenCodeGeeX-13B22.9开源清华大学https://github.com/THUDM/CodeGeeXCodex-12B28.8不开源OpenAICodeT5Plus-16B-mono3…

Flink CDC系列之:Oracle CDC Connector

Flink CDC系列之:Oracle CDC Connector 一、依赖关系二、SQL 客户端 JAR三、设置Oracle1.对于非 CDB 数据库2.对于CDB数据库四、创建Oracle CDC table五、连接器选项六、局限性七、可用元数据八、特征1. Exactly-Once处理2.启动阅读位置3.单线程读取4.数据流源九、数据类型映射…

excel逻辑函数篇1

1、AND(logical1,[logical2],…):用于测试所有条件是否均为TRUE 检查所有参数均为true,如果是则返回true 2、OR(logical1,[logical2],…):用于测试是否有为TRUE的条件 如果任意参数值为true,即返回true;只有当所有参数…

G0第26章:微服务概述与gRPCprotocol buffers

Go微服务与云原生 1、微服务架构介绍 单体架构(电商) SOA架构(电商) 微服务架构(电商) 优势 挑战 拆分 发展史 第一代:基于RPC的传统服务架构 第二代:Service Mesh(istio) 微服务架构分层 核心组件 Summar…

Lua + Redis 实战代码

--[[luarocks install luasocket module socket not foundhttps://github.com/nrk/redis-lua最历害的是,用redis 去跑lua,分布式锁,限流,]]--local redis require("redis");local config{host"127.0.0.1&…

图像处理常见的两种拉流方式

传统算法或者深度学习在进行图像处理之前,总是会首先进行图像的采集,也就是所谓的拉流。解决拉流的方式有两种,一个是直接使用opencv进行取流,另一个是使用ffmpeg进行取流,如下分别介绍这两种方式进行拉流处理。 1、o…

树莓派4B最新系统Bullseye 64 bit使用xrdp远程桌面黑屏卡顿问题

1、树莓派换源 打开源文件 sudo nano /etc/apt/sources.list注释原来的,更换为清华源 deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye main contrib non-free deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye-updates main contrib no…

zotero在不同系统的安装(win/linux)

1 window系统安装 zotero 官网: https://www.zotero.org/ 官方文档 :https://www.zotero.org/support/ (官方)推荐常用的插件: https://www.zotero.org/support/plugins 入门视频推荐: Zotero 文献管理与知识整理最佳实践 点击 exe文件自…