实例级监控
实例级监控关注于单个实例,无论是一台机器,一个数据库实例,一个连接池实例,还是负载均衡器,指标导出器,都可以在实例级监控中找到最详细的信息。
This the multi-page printable view of this section. Click here to print.
实例级监控关注于单个实例,无论是一台机器,一个数据库实例,一个连接池实例,还是负载均衡器,指标导出器,都可以在实例级监控中找到最详细的信息。
PG Instance 详细展示了单个数据库实例的完整指标信息
以最近1日为周期的统计信息(从当前时刻算起的前24小时),比如最近一天的查询总数,返回的记录总数等。上面两行是节点级别的统计,下面两行是主要是PG相关的统计指标。
对于计量计费,水位评估特别有用。
事务部分用于洞悉实例中的活动情况,包括TPS,响应时间,锁等。
TPS概览信息:TPS,TPS与过去两天的DoD环比。DB事务数与回滚数
回滚事务数量与回滚率
TPS详情:绿色条带为±1σ,黄色条带为±3σ,以过去30分钟作为计算标准,通常超出黄色条带可认为TPS波动过大
Xact RT,事务平均响应时间,从连接池抓取。绿色条带为±1σ,黄色条带为±3σ。
TPS与RT的偏离程度,是一个无量纲的可横向比较的值,越大表示指标抖动越厉害。$(μ/σ)^2$
按照DB细分的TPS与事务响应时间,通常一个实例只有一个DB,但少量实例有多个DB。
事务数,回滚数(TPS来自连接池,而这两个指标直接来自DB本身)
锁的数量,按模式聚合(8种表锁),按大类聚合(读锁,写锁,排他锁)
大多数指标与事务中的指标类似,不过统计单位从事务变成了查询语句。查询部分可用于分析实例上的慢查询,定位性能瓶颈。
语句展示了查询中按语句细分的指标。每条语句(查询语法树抽离常量变量后如果一致,则算同一条查询)都会有一个查询ID,可以在慢查询平台中获取到具体的语句与详细指标与统计。
pg_stat_statments
中的平均响应时间从大到小排序的,点击查询ID会自动跳转到慢查询平台后端进程用于显示与PG本身的连接,后端进程相关的统计指标。特别是按照各种维度进行聚合的结果,特别适合定位雪崩,慢查询,其他疑难杂症。
连接池部分与后端进程部分类似,但全都是从Pgbouncer中间件上获取的监控指标
Database部分主要来自pg_stat_database
与pg_database
,包含数据库相关的指标:
持久化主要包含数据落盘,Checkpoint,块访问相关的指标
Exporter展示了监控系统组件本身的监控指标,包括:
Node详细展示了单个机器节点的指标,该面板可用于任何安装有Node Exporter的节点
PG Pgbouncer 详细展示了单个数据库连接池实例的完整指标信息
PG Proxy 详细展示了单个数据库代理 Haproxy 的状态信息
PG Exporter 详细展示了单个数据库实例的监控指标导出器本身的健康状态
PG Setting 详细展示了单个数据库实例的完整指标信息
PG Stat Activity 详细展示了单个数据库实例内的实时活动,注意这里的数据是从Catalog中实时获取,而非监控系统采集。
PG Stat Statements 详细展示了单个数据库实例内实时的查询状态统计