017、数据库管理之监控

news/2024/5/19 14:53:36 标签: 数据库, 开发语言, 分布式数据库, TiDB

监控工具

  • 报警系统
    • 报警级别
    • 指标
    • 系统常用监控指标
    • Service Port Status 常用监控指标
    • PD的常用监控指标
    • TiDB-Server的常用监控指标
    • TiKV 的常用监控指标
    • Dashboard的常用指标
  • 实验: 通过监控工具查看相关指标

TiDB_2">TiDB数据库的监控体系

在这里插入图片描述
promethues : 时序数据库

TiDB_Dashboard_6">TiDB Dashboard

在这里插入图片描述

  • 了解集群整体运行概况
  • 查看组件及主机运行状态
  • 分析集群读写流量分布及趋势变化
  • 列出所有SQL查询的耗时等执行信息
  • 详细了解耗时较长的SQL语句的执行信息
  • 诊断常见集群问题并生成报告
  • 查询所有组件日志
  • 收集分析各个组件的性能数据

这个Dashboard 是包含在PD当中

数据库监控系统数据流转

在这里插入图片描述

监控系统访问地址

  • prometheus + grafana 的监控
http://{Grafana 的服务器IP地址}3000
http://{pd-ip}:2379/dashboard

报警系统

报警级别

在这里插入图片描述

指标

  • 指标
    PD_cluster_offline_tikv_nums
  • 报警规则
    sum(pd_cluster_status {type=“store_down_count”}) > 0
  • 规则描述
    PD长时间(默认配置是30分钟)没有收到TiKV心跳。

系统常用监控指标

在这里插入图片描述

  • CPU配置
  • 内存配置
  • 网络状态
  • 内存使用率

Service Port Status 常用监控指标

  • 在线的节点数量
  • 不在线的接待数量
    在这里插入图片描述

PD的常用监控指标

  • 总大小
  • regions数
  • 是否有错误
  • 使用大小
  • region监控信息
    在这里插入图片描述

TiDBServer_68">TiDB-Server的常用监控指标

  • 每秒执行SQL数量
  • SQL的平均处理时间
  • 连接数量
  • 内存使用量
    在这里插入图片描述

TiKV 的常用监控指标

  • leader数量
  • region数量
  • cpu负载
  • 内存使用量
    在这里插入图片描述

Dashboard的常用指标

  • 实例状况
  • 集群QPS
  • 主机状况
  • 延迟监控
    在这里插入图片描述

实验: 通过监控工具查看相关指标

1、确认TiDB集群状态
Dashboard URL: http://192.168.16.10:2379/dashboard
grafana URL:http://192.168.16.10:3000

[root@tiup pd-2379]# tiup cluster display tidb-test
tiup is checking updates for component cluster ...timeout(2s)!
Starting component `cluster`: /root/.tiup/components/cluster/v1.12.3/tiup-cluster display tidb-test
Cluster type:       tidb
Cluster name:       tidb-test
Cluster version:    v6.1.6
Deploy user:        root
SSH type:           builtin
Dashboard URL:      http://192.168.16.10:2379/dashboard
Grafana URL:        http://192.168.16.10:3000
ID                   Role          Host           Ports        OS/Arch       Status   Data Dir                      Deploy Dir
--                   ----          ----           -----        -------       ------   --------                      ----------
192.168.16.10:9093   alertmanager  192.168.16.10  9093/9094    linux/x86_64  Up       /tidb-data/alertmanager-9093  /tidb-deploy/alertmanager-9093
192.168.16.10:3000   grafana       192.168.16.10  3000         linux/x86_64  Up       -                             /tidb-deploy/grafana-3000
192.168.16.10:2379   pd            192.168.16.10  2379/2380    linux/x86_64  Up|L|UI  /tidb-data/pd-2379            /tidb-deploy/pd-2379
192.168.16.10:9090   prometheus    192.168.16.10  9090/12020   linux/x86_64  Up       /tidb-data/prometheus-9090    /tidb-deploy/prometheus-9090
192.168.16.10:4000   tidb          192.168.16.10  4000/10080   linux/x86_64  Up       -                             /tidb-deploy/tidb-4000
192.168.16.10:20160  tikv          192.168.16.10  20160/20180  linux/x86_64  Up       /tidb-data/tikv-20160         /tidb-deploy/tikv-20160
Total nodes: 6

2、访问Grafana 监控,默认admin/admin
在这里插入图片描述
3、选择需要监控的实例tidb-test.
展开后找到tidb-test-overview,查看相应内容。
在这里插入图片描述
在这里插入图片描述
4、展开tidb-test-overview的system-info,查看整个TiDB数据库鄋的服务器监控指标

在这里插入图片描述

5、Service Port Status
收起system-info,展开tidb-test-overview的service port status,会看到各个节点在线状况
在这里插入图片描述

6、查看PD监控项
收起Service Port status,展开tidb-test-Overview的PD监控项,会看到各个PD节点的监控指标
在这里插入图片描述
7、查看TiDB监控项
收起PD监控项,展开tidb-test-Overview的TiDB监控项,会看到各个TiDB-Server节点的监控指标
在这里插入图片描述

8、查看TiKV监控项
收起TiDB监控项,展开tidb-test-Overview的TiKV监控项,会看到各个TiKV节点的监控指标
在这里插入图片描述

9、查看DashBoard
默认登录用户root,没有密码
在这里插入图片描述

10、查看TiDB的整体QPS 和 SQL延迟
在这里插入图片描述


http://www.niftyadmin.cn/n/453521.html

相关文章

深度学习-【图像分类】学习笔记8 ShuffleNet

文章目录 8.1 ShuffleNet v1 v2理论讲解ShuffleNet v1ShuffleNet v2 8.2 使用Pytorch搭建ShuffleNet 8.1 ShuffleNet v1 v2理论讲解 ShuffleNet v1 论文链接:https://readpaper.com/paper/2963125010 Channel shuffle 相关链接:深度学习-【图像分类】…

既有内销又有外贸,多样性外贸业务管理解决方案

随着外贸数字化贸易全球化的深入发展,出口、进口、内销业务越来越受到关注。外贸业务是企业在海外市场进行商品贸易,而内销业务是企业在国内市场进行商品贸易。在管理这种业务时,想要实现降本增效,企业需要有一套成熟的管理解决方…

chatgpt赋能python:Python收费怎么办?

Python收费怎么办? Python是一门非常流行的编程语言,特别是在数据科学和机器学习领域中。许多人使用Python来编写自己的应用程序和脚本,但是有些人会对Python的收费问题感到困惑。本文将介绍Python的收费情况以及如何解决这个问题。 Python…

阿里云国际版云服务器ECS按量付费怎么转包年包月?

创建一台按量付费ECS实例后,您可以将ECS实例的计费方式转为包年包月,提前预留资源,同时享受更大的价格优惠。一起了解阿里云国际版云服务器ECS按量付费转包年包月: 前提条件 请确认待转换的按量付费ECS实例满足以下条件&#xff1…

技术讨论:我心中TOP1的编程语言

欢迎关注博主 六月暴雪飞梨花 或加入【六月暴雪飞梨花】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和技术…

reduce是什么东西,在实际开发中应该如何正确使用?

reduce() 方法是 JavaScript 中的一个高阶函数,可以用于对数组中的所有元素依次调用指定的回调函数,最终返回一个输出结果。reduce() 方法非常强大,可以应用于许多场景中,以下是一些常用的应用场景: 数组求和可以使用 reduce() 方法对一个数组中的所有元素进行求和。例如:…

统计学_贾俊平——思考题第14章指数

1.什么是指数?它有哪些性质? 指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。它有如下一些性质: (1)相对性。指数是总体各变量在不同场合下对比形成的相对数,它可…

spring security oauth2 整合 JWT

前言 在这个基础上&#xff0c;进行整合。 spring security oauth2学习 -- 快速入门_本郡主是喵的博客-CSDN博客 1.jwt的一般使用 先把 reids,common-pools 等依赖删掉。 删掉redis的下相关配置 1.1 导入依赖 <!--jjwt--><dependency><groupId>io.json…