TiDB 查询优化及调优系列（三）慢查询诊断监控及排查

返回全部

Yu Dong 产品技术解读 2022-05-05

本章节介绍如何利用 TiDB 提供的系统监控诊断工具，对运行负载中的查询进行排查和诊断。除了上一章节介绍的通过 EXPLAIN 语句来查看诊断查询计划问题外，本章节主要会介绍通过 TiDB Slow Query 慢查询内存表，以及 TiDB Dashboard 的可视化 Statements 功能来监控和诊断慢查询。

下载 TiDB 社区版

了解 TiDB 企业版

免费试用 TiDB Cloud

适用于中国出海企业和开发者

Slow Query 慢查询内存表

TiDB 默认会启用慢查询日志，并将执行时间超过规定阈值的 SQL 保存到日志文件。慢查询日志常用于定位慢查询语句，分析和解决 SQL 的性能问题。通过系统表information_schema.slow_query也可以查看当前 TiDB 节点的慢查询日志，其字段与慢查询日志文件内容一致。TiDB 从 4.0 版本开始又新增了系统表information_schema.cluster_slow_query，可以用于查看全部 TiDB 节点的慢查询。

本节将首先简要介绍慢查询日志的格式和字段含义，然后针对上述两种慢查询系统表给出一些常见的查询示例。

慢查询日志示例及字段说明

下面是一段典型的慢查询日志：

#Time: 2019-08-14T09:26:59.487776265+08:00#Txn_start_ts: 410450924122144769#User: root@127.0.0.1#Conn_ID: 3086#查询_time: 1.527627037#Parse_time: 0.000054933#Compile_time: 0.000129729#Process_time: 0.07 Wait_time: 0.002 Backoff_time: 0.002 Request_count: 1 Total_keys: 131073 Process_keys: 131072 Prewrite_time: 0.335415029 Commit_time: 0.032175429 Get_commit_ts_time: 0.000177098 Local_latch_wait_time: 0.106869448 Write_keys: 131072 Write_size: 3538944 Prewrite_region: 1#DB:test#Is_internal:false#Digest: 50a2e32d2abbd6c1764b1b7f2058d428ef2712b029282b776beb9506a365c0f1#Stats: t:414652072816803841#Num_cop_tasks: 1#Cop_proc_avg: 0.07 Cop_proc_p90: 0.07 Cop_proc_max: 0.07 Cop_proc_addr: 172.16.5.87:20171#Cop_wait_avg: 0 Cop_wait_p90: 0 Cop_wait_max: 0 Cop_wait_addr: 172.16.5.87:20171#Mem_max: 525211#Succ:true#Plan_digest: e5f9d9746c756438a13c75ba3eedf601eecf555cdb7ad327d7092bdd041a83e7#Plan: tidb_decode_plan('ZJAwCTMyXzcJMAkyMAlkYXRhOlRhYmxlU2Nhbl82CjEJMTBfNgkxAR0AdAEY1Dp0LCByYW5nZTpbLWluZiwraW5mXSwga2VlcCBvcmRlcjpmYWxzZSwgc3RhdHM6cHNldWRvCg==')insert into t select * from t;

以下逐一介绍慢查询日志中各个字段的含义。

注意：慢查询日志中所有时间相关字段的单位都是秒。

(1) 慢查询基础信息：

Time：表示日志打印时间。
查询_time：表示执行该语句花费的时间。
Parse_time：表示该语句在语法解析阶段花费的时间。
Compile_time：表示该语句在查询优化阶段花费的时间。
Digest：表示该语句的 SQL 指纹。
Stats：表示 table 使用的统计信息版本时间戳。如果时间戳显示为pseudo，表示用默认假设的统计信息。
Txn_start_ts：表示事务的开始时间戳，也就是事务的唯一 ID，可以用该值在 TiDB 日志中查找事务相关的其他日志。
Is_internal：表示是否为 TiDB 内部的 SQL 语句。true表示是 TiDB 系统内部执行的 SQL 语句，false表示是由用户执行的 SQL 语句。
Index_ids：表示该语句使用的索引 ID。
Succ：表示该语句是否执行成功。
Backoff_time：表示遇到需要重试的错误时该语句在重试前等待的时间。常见的需要重试的错误有以下几种：遇到了 lock、Region 分裂、tikv server is busy。
Plan_digest：表示 plan 的指纹。
Plan：表示该语句的执行计划，运行select tidb_decode_plan('...')可以解析出具体的执行计划。
查询：表示该 SQL 语句。慢日志里不会打印字段名 Query，但映射到内存表后对应的字段叫查询。

(2) 和事务执行相关的字段：

Prewrite_time：表示事务两阶段提交中第一阶段（prewrite阶段）的耗时。
Commit_time：表示事务两阶段提交中第二阶段（commit阶段）的耗时。
Get_commit_ts_time：表示事务两阶段提交中第二阶段（commit阶段）获取commit时间戳的耗时。
Local_latch_wait_time：表示事务两阶段提交中第二阶段（commit阶段）发起前在 TiDB 侧等锁的耗时。
Write_keys：表示该事务向 TiKV 的 Write CF 写入 Key 的数量。
Write_size：表示事务提交时写 key 和 value 的总大小。
Prewrite_region：表示事务两阶段提交中第一阶段（prewrite阶段）涉及的 TiKV Region 数量。每个 Region 会触发一次远程过程调用。

(3) 和内存使用相关的字段：

Memory_max：表示执行期间 TiDB 使用的最大内存空间，单位为byte。

(4) 和用户相关的字段：

User：表示执行语句的用户名。
Conn_ID：表示用户的连接 ID，可以用类似con:3的关键字在 TiDB 日志中查找该链接相关的其他日志。
DB：表示执行语句时使用的 database。

(5) 和 TiKV Coprocessor Task 相关的字段：

Process_time：该 SQL 在 TiKV 上的处理时间之和。因为数据会并行发到 TiKV 执行，该值可能会超过查询_time。
Wait_time：表示该语句在 TiKV 上的等待时间之和。因为 TiKV 的 Coprocessor 线程数是有限的，当所有的 Coprocessor 线程都在工作的时候，请求会排队；若队列中部分请求耗时很长，后面的请求的等待时间会增加。
Request_count：表示该语句发送的 Coprocessor 请求的数量。
Total_keys：表示 Coprocessor 扫过的 key 的数量。
Process_keys：表示 Coprocessor 处理的 key 的数量。相较于total_keys，processed_keys 不包含 MVCC 的旧版本。如果processed_keys和total_keys相差很大，说明旧版本比较多。
Cop_proc_avg：cop-task 的平均执行时间。
Cop_proc_p90：cop-task 的 P90 分位执行时间。
Cop_proc_max：cop-task 的最大执行时间。
Cop_proc_addr：执行时间最长的 cop-task 所在地址。
Cop_wait_avg：cop-task 的平均等待时间。
Cop_wait_p90：cop-task 的 P90 分位等待时间。
Cop_wait_max：cop-task 的最大等待时间。
Cop_wait_addr：等待时间最长的 cop-task 所在地址。

Slow Query 内存表使用排查

下面通过一些示例展示如何通过 SQL 查看 TiDB 的慢查询。

检索当前节点N 慢查询

以下 SQL 用于检索当前 TiDB 节点的 Top 2 慢查询：

>selectquery_time, queryfrominformation_schema.slow_query-- 检索当前 TiDB 节点的慢查询whereis_internal =false-- 排除 TiDB 内部的慢查询orderbyquery_timedesclimit2; +--------------+------------------------------------------------------------------+| query_time | query | +--------------+------------------------------------------------------------------+|12.77583857|select*fromt_slim, t_widewheret_slim.c0=t_wide.c0; | |0.734982725|selectt0.c0, t1.c1fromt_slim t0, t_wide t1wheret0.c0=t1.c0; | +--------------+------------------------------------------------------------------+

检索全部节点上指定用户的 Top N 慢查询

以下 SQL 会检索全部 TiDB 节点上指定用户test的 Top 2 慢查询：

>selectquery_time, query,userfrominformation_schema.cluster_slow_query-- 检索全部 TiDB 节点的慢查询whereis_internal =falseanduser= "test"orderbyquery_timedesclimit2; +-------------+------------------------------------------------------------------+----------------+| Query_time | query |user| +-------------+------------------------------------------------------------------+----------------+|0.676408014|selectt0.c0, t1.c1fromt_slim t0, t_wide t1wheret0.c0=t1.c1; | test | +-------------+------------------------------------------------------------------+----------------+

检索同类慢查询

在得到 Top N 慢查询后，可通过 SQL 指纹继续检索同类慢查询。

——先获取前N的慢查询和对应的SQL指纹>selectquery_time, query, digestfrominformation_schema.cluster_slow_querywhereis_internal =falseorderbyquery_timedesclimit1; +-------------+-----------------------------+------------------------------------------------------------------+| query_time | query | digest | +-------------+-----------------------------+------------------------------------------------------------------+|0.302558006|select*fromt1wherea=1; |4751cb6008fda383e22dacb601fde85425dc8f8cf669338d55d944bafb46a6fa | +-------------+-----------------------------+------------------------------------------------------------------+-- 再根据 SQL 指纹检索同类慢查询>selectquery, query_timefrominformation_schema.cluster_slow_querywhere消化= " 4751 cb6008fda383e22dacb601fde85425dc8f8cf669338d55d944bafb46a6fa"; +-----------------------------+-------------+| query | query_time | +-----------------------------+-------------+|select*fromt1wherea=1; |0.302558006| |select*fromt1wherea=2; |0.401313532| +-----------------------------+-------------+

检索统计信息为pseudo的慢查询

如果慢查询日志中的统计信息被标记为pseudo，往往说明 TiDB 表的统计信息更新不及时，需要运行analyze table手动收集统计信息。以下 SQL 可以找到这一类慢查询：

如果慢查询日志中的统计信息被标记为 pseudo，往往说明 TiDB 表的统计信息更新不及时，需要运行analyzetable手动收集统计信息。以下SQL可以找到这一类慢查询： >selectquery, query_time, statsfrominformation_schema.cluster_slow_querywhereis_internal =falseandstatslike'%pseudo%'; +-----------------------------+-------------+---------------------------------+| query | query_time | stats | +-----------------------------+-------------+---------------------------------+|select*fromt1wherea=1; |0.302558006| t1:pseudo | |select*fromt1wherea=2; |0.401313532| t1:pseudo | |select*fromt1wherea>2; |0.602011247| t1:pseudo | |select*fromt1wherea>3; |0.50077719| t1:pseudo | |select*fromt1joint2; |0.931260518| t1:407872303825682445,t2:pseudo | +-----------------------------+-------------+---------------------------------+

查询执行计划发生变化的慢查询

由于统计信息不准，可能导致同类型 SQL 的执行计划发生意料之外的改变。用以下 SQL 可以检索到哪些慢查询具有多种不同的执行计划：

> select count(distinct plan_digest) as count, digest,min(query) from information_schema.cluster_slow_querygroup by digest having count>1 limit 3\G***************************[ 1. row ]*************************** count | 2 digest | 17b4518fde82e32021877878bec2bb309619d384fca944106fcaf9c93b536e94 min(query) | SELECT DISTINCT c FROM sbtest25 WHERE id BETWEEN ? AND ? ORDER BY c [arguments: (291638, 291737)];***************************[ 2. row ]*************************** count | 2 digest | 9337865f3e2ee71c1c2e740e773b6dd85f23ad00f8fa1f11a795e62e15fc9b23 min(query) | SELECT DISTINCT c FROM sbtest22 WHERE id BETWEEN ? AND ? ORDER BY c [arguments: (215420, 215519)];***************************[ 3. row ]*************************** count | 2 digest | db705c89ca2dfc1d39d10e0f30f285cbbadec7e24da4f15af461b148d8ffb020 min(query) | SELECT DISTINCT c FROM sbtest11 WHERE id BETWEEN ? AND ? ORDER BY c [arguments: (303359, 303458)];

-- 借助 SQL 指纹进一步查询执行计划的详细信息>selectmin(plan),plan_digestfrominformation_schema.cluster_slow_querywheredigest='17b4518fde82e32021877878bec2bb309619d384fca944106fcaf9c93b536e94'groupbyplan_digest\G ***************************1.row*************************** min(plan): Sort_6 root100.00131380758702sbtest.sbtest25.c:asc└─HashAgg_10 root100.00131380758702groupby:sbtest.sbtest25.c, funcs:firstrow(sbtest.sbtest25.c)->sbtest.sbtest25.c └─TableReader_15 root100.00131380758702data:TableRangeScan_14 └─TableScan_14 cop100.00131380758702table:sbtest25, range:[502791,502890], keeporder:falseplan_digest:6afbbd21f60ca6c6fdf3d3cd94f7c7a49dd93c00fcf8774646da492e50e204ee ***************************2.row*************************** min(plan): Sort_6 root1sbtest.sbtest25.c:asc└─HashAgg_12 root1groupby:sbtest.sbtest25.c, funcs:firstrow(sbtest.sbtest25.c)->sbtest.sbtest25.c └─TableReader_13 root1data:HashAgg_8 └─HashAgg_8 cop1groupby:sbtest.sbtest25.c, └─TableScan_11 cop1.2440069558121831table:sbtest25, range:[472745,472844], keeporder:false

统计各个节点的慢查询数量

以下 SQL 统计指定时段内各个 TiDB 节点上出现过的慢查询数量：

>selectinstance, count(*)frominformation_schema.cluster_slow_querywheretime>= "2020-03-06 00:00:00"andtime< now()groupbyinstance; +---------------+----------+| instance | count(*) | +---------------+----------+|0.0.0.0:10081|124| |0.0.0.0:10080|119771| +---------------+----------+

检索异常时段的慢查询

假定2020-03-10 13:24:00至2020-03-10 13:27:00期间发现 QPS 降低和查询响应时间升高等问题，可以用以下 SQL 过滤出仅仅出现在异常时段的慢查询：

>select*from(select/*+ AGG_TO_COP(), HASH_AGG() */count(*), min(time), sum(query_time)ASsum_query_time, sum(Process_time)ASsum_process_time, sum(Wait_time)ASsum_wait_time, sum(Commit_time), sum(Request_count), sum(process_keys), sum(Write_keys), max(Cop_proc_max), min(query),min(prev_stmt), digestfrominformation_schema.cluster_slow_querywheretime>='2020-03-10 13:24:00'andtime<'2020-03-10 13:27:00'adn Is_internal =falsegroupbydigest)ASt1wheret1.digestnotin(select/*+ AGG_TO_COP(), HASH_AGG() */digestfrominformation_schema.cluster_slow_querywheretime>='2020-03-10 13:20:00'-- 排除正常时段 `2020-03-10 13:20:00` ~ `2020-03-10 13:23:00` 期间的慢查询andtime<'2020-03-10 13:23:00'groupbydigest)orderbyt1.sum_query_timedesclimit10\G ***************************[1.row]*************************** count(*) |200min(time) |2020-03-1013:24:27.216186sum_query_time |50.114126194sum_process_time |268.351sum_wait_time |8.476sum(Commit_time) |1.044304306sum(Request_count) |6077sum(process_keys) |202871950sum(Write_keys) |319500max(Cop_proc_max) |0.263min(query) |deletefromtest.tcs2limit5000; min(prev_stmt) | digest |24bd6d8a9b238086c9b8c3d240ad4ef32f79ce94cf5a468c0b8fe1eb5f8d03df

TiDB Dashboard 可视化 Statements

上一节介绍了利用 Slow Query 内存表来排查慢查询，但 Slow Query 只会记录超过慢日志阈值的 SQL 而缺少对全部运行负载的诊断排查。本节会介绍通过使用 TiDB Dashboard 来排查定位问题查询。TiDB Dashboard 提供了 Statements 用来监控和统计 SQL，例如页面上提供了丰富的列表信息，包括延迟、执行次数、扫描行数、全表扫描次数等，用来分析哪些类别的 SQL 语句耗时过长、消耗内存过多等情况，帮助用户定位性能问题。

TiDB 已支持多种性能排查工具。但在多种应用场景需求下，仍有不足，例如：

1.Grafana 不能排查单条 SQL 的性能问题

2.Slow log 只记录超过慢日志阀值的 SQL

3.General log 本身对性能有一定影响

4.Explain analyze 只能查看可以复现的问题

5.Profile 只能查看整个实例的瓶颈

因此推出可视化 Statements，可以直接在页面观察 SQL 执行情况，不需要查询系统表，便于用户定位性能问题。

使用 TiDB Dashboard

从4.0版本开始，TiDB 提供了一个新的 Dashboard 运维管理工具，集成在 PD 组件上，默认地址为http://pd-url:pd_port/dashboard。不同于 Grafana 监控是从数据库的监控视角出发，TiDB Dashboard 从 DBA 管理员角度出发，最大限度的简化管理员对 TiDB 数据库的运维，可在一个界面查看到整个分布式数据库集群的运行状况，包括数据热点、SQL 运行情况、集群信息、日志搜索、实时性能分析等。

查看 Statements 整体情况

登录后，在左侧点击「SQL 语句分析」即可进入此功能页面。

在时间区间选项框中选择要分析的时间段，即可得到该时段所有数据库的 SQL 语句执行统计情况。

如果只关心某些数据库，则可以在第二个选项框中选择相应的数据库对结果进行过滤，支持多选。

结果以表格的形式展示，并支持按不同的列对结果进行排序，如下图所示。

1.选择需要分析的时间段

2.支持按数据库过滤

3.支持按不同的指标排序

注意：这里所指的 SQL 语句实际指的是某一类 SQL 语句。语法一致的 SQL 语句会规一化为一类相同的 SQL 语句。

例如：

SELECT*FROMemployeeWHEREidIN(1,2,3);select*fromEMPLOYEEwhereIDin(4,5);

规一化为

select*fromemployeewhereidin(...);

在 SQL 类别列，点击某类 SQL 语句，可以进入该 SQL 语句的详情页查看更详细的信息，以及该 SQL 语句在不同节点上执行的统计情况。

单个 Statements 详情页关键信息如下图所示。

1.SQL 执行总时长

2.平均影响行数（一般是写入）

3.平均扫描行数（一般是读）

4.各个节点执行指标（可以快速定位出某个节点性能瓶颈）

Statements 参数配置

tidb_enable_stmt_summaryStatements 功能默认开启，也可以通过设置系统变量打开，例如：

setglobaltidb_enable_stmt_summary =true;

tidb_stmt_summary_refresh_interval

设置performance_schema.events_statements_summary_by_digest表的的清空周期，单位是秒 (s)，默认值是 1800，例如：

set global tidb_stmt_summary_refresh_interval=1800;

tidb_stmt_summary_history_size设置performance_schema.events_statements_summary_by_digest_history表保存每种 SQL 的历史的数量，默认值是 24，例如：

set global tidb_stmt_summary_history_size=24;

由于 Statements 信息是存储在内存表中，为了防止内存溢出等问题，需要限制保存的 SQL 条数和 SQL 的最大显示长度。这两个参数需要在 config.toml 的[stmt-summary]类别下配置：

通过max-stmt-count更改保存的 SQL 种类数量，默认 200 条。当 SQL 种类超过max-stmt-count时，会移除最近没有使用的 SQL
通过max-sql-length更改DIGEST_TEXT和QUERY_SAMPLE_TEXT的最大显示长度，默认是 4096

注意：tidb_stmt_summary_history_size、max-stmt-count、max-sql-length几项配置影响内存占用，建议根据实际情况调整，不宜设置得过大。

综上所述，可视化 Statements 可以快速定位某个 SQL 性能问题。

本文为「TiDB 查询优化及调优」系列文章的第三篇，前文我们分别介绍了优化器的基本概念和TiDB 的查询计划，后续将继续对 TiDB 调整及优化查询执行计划、其他优化器开发或规划中的诊断调优功能等进行介绍。如果您对 TiDB 的产品有任何建议，欢迎来到internals.tidb.io与我们交流。

点击查看更多TiDB 查询优化及调优文章

TiDB 查询优化及调优系列（三）慢查询诊断监控及排查

Slow Query 慢查询内存表

慢查询日志示例及字段说明

Slow Query 内存表使用排查

TiDB Dashboard 可视化 Statements

使用 TiDB Dashboard

查看 Statements 整体情况

Statements 参数配置

目录

关于我们

资源中心

联系我们

PingCAP 公司