实例级监控
实例级监控关注于单个实例,无论是一台机器,一个数据库实例,一个连接池实例,还是负载均衡器,指标导出器,都可以在实例级监控中找到最详细的信息。
实例级监控关注于单个实例,无论是一台机器,一个数据库实例,一个连接池实例,还是负载均衡器,指标导出器,都可以在实例级监控中找到最详细的信息。
PG Instance 详细展示了单个数据库实例的完整指标信息
以最近1日为周期的统计信息(从当前时刻算起的前24小时),比如最近一天的查询总数,返回的记录总数等。上面两行是节点级别的统计,下面两行是主要是PG相关的统计指标。
对于计量计费,水位评估特别有用。
事务部分用于洞悉实例中的活动情况,包括TPS,响应时间,锁等。
TPS概览信息:TPS,TPS与过去两天的DoD环比。DB事务数与回滚数
回滚事务数量与回滚率
TPS详情:绿色条带为±1σ,黄色条带为±3σ,以过去30分钟作为计算标准,通常超出黄色条带可认为TPS波动过大
Xact RT,事务平均响应时间,从连接池抓取。绿色条带为±1σ,黄色条带为±3σ。
TPS与RT的偏离程度,是一个无量纲的可横向比较的值,越大表示指标抖动越厉害。$(μ/σ)^2$
按照DB细分的TPS与事务响应时间,通常一个实例只有一个DB,但少量实例有多个DB。
事务数,回滚数(TPS来自连接池,而这两个指标直接来自DB本身)
锁的数量,按模式聚合(8种表锁),按大类聚合(读锁,写锁,排他锁)
大多数指标与事务中的指标类似,不过统计单位从事务变成了查询语句。查询部分可用于分析实例上的慢查询,定位性能瓶颈。
语句展示了查询中按语句细分的指标。每条语句(查询语法树抽离常量变量后如果一致,则算同一条查询)都会有一个查询ID,可以在慢查询平台中获取到具体的语句与详细指标与统计。
pg_stat_statments
中的平均响应时间从大到小排序的,点击查询ID会自动跳转到慢查询平台后端进程用于显示与PG本身的连接,后端进程相关的统计指标。特别是按照各种维度进行聚合的结果,特别适合定位雪崩,慢查询,其他疑难杂症。
连接池部分与后端进程部分类似,但全都是从Pgbouncer中间件上获取的监控指标
Database部分主要来自pg_stat_database
与pg_database
,包含数据库相关的指标:
持久化主要包含数据落盘,Checkpoint,块访问相关的指标
Exporter展示了监控系统组件本身的监控指标,包括:
PG Instance 详细展示了单个数据库实例的完整指标信息。
Pigsty日志基于Loki 与 Promtail,是可选的额外模组。
您必须先在元节点上执行 infra-loki.yml
并在普通数据节点上执行 pgsql-promtail.yml
方能启用本功能。
用户可以从这里查阅 每个实例上 Postgres, Pgbouncer, Patroni的相关日志。
上方的三个图表显示的是当前时间段中的Log Rate,单位时间内的日志数量。
Search框中可以填入关键字搜索,右上角的Log Rate显示的是包含该关键字的Log Rate。
Node详细展示了单个机器节点的指标,该面板可用于任何安装有Node Exporter的节点
PG Pgbouncer 详细展示了单个数据库连接池实例的完整指标信息
PG Proxy 详细展示了单个数据库代理 Haproxy 的状态信息
PG Exporter 详细展示了单个数据库实例的监控指标导出器本身的健康状态
PG Setting 详细展示了单个数据库实例的完整指标信息
PG Stat Activity 详细展示了单个数据库实例内的实时活动,注意这里的数据是从Catalog中实时获取,而非监控系统采集。
PG Stat Statements 详细展示了单个数据库实例内实时的查询状态统计