Als de werkbelasting van uw database overbelast is, wilt u eerst kijken welke query's worden uitgevoerd in een poging het patroon van de query te zien. Schrijft het zwaar? Zwaar lezen? Waar zit de bottleneck?
Queryproblemen identificeren
Om erachter te komen, kun je het algemene logboek of het langzame logboek inschakelen om te proberen de zoekopdrachten vast te leggen die worden uitgevoerd en naar het bestand te schrijven. U kunt ook lezen uit het binaire logboek (aangezien het binaire logboek alle wijzigingen in de database vastlegt) en rechtstreeks naar de leesbewerkingen kijken vanuit de lopende proceslijst in de database. U kunt de zoekopdracht zelfs vastleggen vanuit het netwerkperspectief door via tcpdump te kijken.
Wat nu te doen? U kunt de query analyseren die is geschreven naar een algemeen logbestand, langzaam logbestand, binair logbestand om te controleren of er iets interessants aan de hand is (bijv. bottleneck in de query).
Percona heeft een tool om dit type queries te analyseren, genaamd pt-query-digest. Het wordt meegeleverd wanneer u de Percona Toolkit installeert, een verzameling hulpprogramma's waarmee DBA hun databases kan beheren. In deze blog bekijken we deze tool en hoe deze zich verhoudt tot de Query Management-functies van ClusterControl.
Installatieprocedure
Percona-repository's ondersteunen twee Linux-distributiepakketten voor installatie, namelijk op Debian gebaseerde en op RPM gebaseerde pakketdistributie. De installatie is eenvoudig zoals hieronder getoond:
Debian-gebaseerd pakket (Ubuntu, Debian)
Configureer Percona-pakketopslagplaatsen door het pakket te downloaden
wget https://repo.percona.com/apt/percona-release_latest.generic_all.deb
En installeer vervolgens het gedownloade pakket met dpkg
sudo dpkg -i percona-release_latest.generic_all.deb
Voer daarna de installatie uit vanuit pakketbeheerder
sudo apt-get install percona-toolkit
RPM-gebaseerd pakket (RHEL, CentOS, Oracle Enterprise Linux, Amazon AMI)
Configureer de opslagplaatsen van Percona-pakketten door het rpm-pakket rechtstreeks te installeren.
sudo yum install https://repo.percona.com/yum/percona-release-latest.noarch.rpm
Voer daarna de installatie uit vanuit pakketbeheerder
sudo apt-get install percona-toolkit
Percona-hulpprogramma's worden op uw computer geïnstalleerd en u hoeft deze alleen maar te gebruiken.
Query werkbelasting analyseren
Er zijn verschillende manieren om de statistieken van de querywerkbelasting te genereren met behulp van pt-query-digest, hieronder is de opdracht hoe dit te doen met behulp van een langzaam querybestand, algemeen bestand, proceslijst weergeven in database, en lees door binaire log.
Genereren uit de database van de showproceslijst
pt-query-digest --processlist h=localhost,D=sbt,u=sbtest,p=12qwaszx --output slowlog > /tmp/slow_query.log
Genereren uit de trage zoekbestanden / algemeen zoekbestand
pt-query-digest mysql-slow.log > /tmp/slow_query.log
Genereren vanuit binair logboek. Voordat u de pt-query-digest uitvoert, moet u het binaire logboek uitpakken in een leesbaar formaat met mysqlbinlog. Vergeet niet de optie --type toe te voegen en binlog als bron in te voeren.
pt-query-digest --type binlog mysql-bin.000001.txt > slow_query.log
Nadat u klaar bent met het genereren van het bestand, ziet u het rapport zoals hieronder weergegeven:
# 12s user time, 170ms system time, 27.44M rss, 221.79M vsz
# Current date: Sun May 10 21:40:47 2020
# Hostname: n2
# Files: mysql-1
# Overall: 94.92k total, 47 unique, 2.79k QPS, 27.90x concurrency ________
# Time range: 2020-05-10 21:39:37 to 21:40:11
# Attribute total min max avg 95% stddev median
# ============ ======= ======= ======= ======= ======= ======= =======
# Exec time 949s 6us 1s 10ms 42ms 42ms 2ms
# Lock time 31s 0 1s 327us 80us 11ms 22us
# Rows sent 69.36k 0 490 0.75 0.99 11.30 0
# Rows examine 196.34k 0 490 2.12 0.99 21.03 0.99
# Rows affecte 55.28k 0 15 0.60 0.99 1.26 0
# Bytes sent 13.12M 11 6.08k 144.93 299.03 219.02 51.63
# Query size 15.11M 5 922 166.86 258.32 83.13 174.84
# Profile
# Rank Query ID Response time Calls R/Call V/M Ite
# ==== ============================= ============== ===== ====== ===== ===
# 1 0xCE367F5CFFCAF46E816F682E... 162.6485 17.1% 199 0.8173 0.03 SELECT order_line? stock?
# 2 0x360F872745C81781F8F75EDE... 107.4898 11.3% 14837 0.0072 0.02 SELECT stock?
# 3 0xE0CE1933D0392DA3A42FAA7C... 102.2281 10.8% 14866 0.0069 0.03 SELECT item?
# 4 0x492B86BCB2B1AE1278147F95... 98.7658 10.4% 14854 0.0066 0.04 INSERT order_line?
# 5 0x9D086C2B787DC3A308043A0F... 93.8240 9.9% 14865 0.0063 0.02 UPDATE stock?
# 6 0x5812BF2C6ED2B9DAACA5D21B... 53.9681 5.7% 1289 0.0419 0.05 UPDATE customer?
# 7 0x51C0DD7AF0A6D908579C28C0... 44.3869 4.7% 864 0.0514 0.03 SELECT customer?
# 8 0xFFFCA4D67EA0A788813031B8... 41.2123 4.3% 3250 0.0127 0.01 COMMIT
# 9 0xFDDEE3813C59881488D9C47F... 36.0707 3.8% 1180 0.0306 0.02 UPDATE customer?
# 10 0x8FBBE0AFA061755CCC1C27AB... 31.6417 3.3% 1305 0.0242 0.03 UPDATE orders?
# 11 0x8AA6EB56551923DB9A49E40A... 23.3281 2.5% 1522 0.0153 0.04 SELECT customer? warehouse?
# 12 0xF34C10B3DA8DB048A630D4C7... 21.1662 2.2% 1305 0.0162 0.03 UPDATE order_line?
# 13 0x59DBA67188951C532AFC2598... 20.8006 2.2% 1503 0.0138 0.33 INSERT new_orders?
# 14 0xDADBEB0FBFA537F5D8722F42... 17.2802 1.8% 1290 0.0134 0.03 SELECT customer?
# 15 0x597A805ADA793440507F3334... 16.4394 1.7% 1516 0.0108 0.03 INSERT orders?
# 16 0x1B1EA568857A6AAC6544B44A... 13.9560 1.5% 1309 0.0107 0.05 SELECT new_orders?
# 17 0xCE3EDD98779478DE17154DCE... 12.1470 1.3% 1322 0.0092 0.05 INSERT history?
# 18 0x9DFD75E88091AA333A777668... 11.6842 1.2% 1311 0.0089 0.05 SELECT orders?
# MISC 0xMISC 39.6393 4.2% 16334 0.0024 0.0 <29 ITEMS>
# Query 1: 6.03 QPS, 4.93x concurrency, ID 0xCE367F5CFFCAF46E816F682E53C0CF03 at byte 30449473
# This item is included in the report because it matches --limit.
# Scores: V/M = 0.03
# Time range: 2020-05-10 21:39:37 to 21:40:10
# Attribute pct total min max avg 95% stddev median
# ============ === ======= ======= ======= ======= ======= ======= =======
# Count 0 199
# Exec time 17 163s 302ms 1s 817ms 992ms 164ms 816ms
# Lock time 0 9ms 30us 114us 44us 84us 18us 36us
# Rows sent 0 199 1 1 1 1 0 1
# Rows examine 39 76.91k 306 468 395.75 441.81 27.41 381.65
# Rows affecte 0 0 0 0 0 0 0 0
# Bytes sent 0 15.54k 79 80 79.96 76.28 0 76.28
# Query size 0 74.30k 382 384 382.35 381.65 0 381.65
# String:
# Databases sbt
# Hosts localhost
# Last errno 0
# Users sbtest
# Query_time distribution
# 1us
# 10us
# 100us
# 1ms
# 10ms
# 100ms ################################################################
# 1s ####
# 10s+
# Tables
# SHOW TABLE STATUS FROM `sbt` LIKE 'order_line6'\G
# SHOW CREATE TABLE `sbt`.`order_line6`\G
# SHOW TABLE STATUS FROM `sbt` LIKE 'stock6'\G
# SHOW CREATE TABLE `sbt`.`stock6`\G
# EXPLAIN /*!50100 PARTITIONS*/
SELECT COUNT(DISTINCT (s_i_id))
FROM order_line6, stock6
WHERE ol_w_id = 1
AND ol_d_id = 1
AND ol_o_id < 3050
AND ol_o_id >= 3030
AND s_w_id= 1
AND s_i_id=ol_i_id
AND s_quantity < 18\G
# Query 2: 436.38 QPS, 3.16x concurrency, ID 0x360F872745C81781F8F75EDE9DD44246 at byte 30021546
# This item is included in the report because it matches --limit.
# Scores: V/M = 0.02
# Time range: 2020-05-10 21:39:37 to 21:40:11
# Attribute pct total min max avg 95% stddev median
# ============ === ======= ======= ======= ======= ======= ======= =======
# Count 15 14837
# Exec time 11 107s 44us 233ms 7ms 33ms 13ms 3ms
# Lock time 1 522ms 15us 496us 35us 84us 28us 23us
# Rows sent 20 14.49k 1 1 1 1 0 1
# Rows examine 7 14.49k 1 1 1 1 0 1
# Rows affecte 0 0 0 0 0 0 0 0
# Bytes sent 28 3.74M 252 282 264.46 271.23 8.65 258.32
# Query size 19 3.01M 209 215 213.05 212.52 2.85 212.52
# String:
# Databases sbt
# Hosts localhost
# Last errno 0
# Users sbtest
# Query_time distribution
# 1us
# 10us #
# 100us ##
# 1ms ################################################################
# 10ms #############
# 100ms #
# 1s
# 10s+
# Tables
# SHOW TABLE STATUS FROM `sbt` LIKE 'stock9'\G
# SHOW CREATE TABLE `sbt`.`stock9`\G
# EXPLAIN /*!50100 PARTITIONS*/
SELECT s_quantity, s_data, s_dist_01 s_dist
FROM stock9
WHERE s_i_id = 60407 AND s_w_id= 2 FOR UPDATE\G
Zoals u kunt zien in het bovenstaande pt-query-digest rapportresultaat, kunnen we in 3 delen verdelen.
Samenvattingsrapport
Er is veel informatie die u kunt vinden in het overzichtsrapport, te beginnen met de hostnaamserver, de datum waarop u de opdracht uitvoert, informatie met betrekking tot de zoekopdracht die is vastgelegd, QPS en het vastleggen van het tijdsbestek. Daarnaast kunt u ook timingstatistieken voor elk kenmerk bekijken.
# 12s user time, 170ms system time, 27.44M rss, 221.79M vsz
# Current date: Sun May 10 21:40:47 2020
# Hostname: n2
# Files: mysql-1
# Overall: 94.92k total, 47 unique, 2.79k QPS, 27.90x concurrency ________
# Time range: 2020-05-10 21:39:37 to 21:40:11
# Attribute total min max avg 95% stddev median
# ============ ======= ======= ======= ======= ======= ======= =======
# Exec time 949s 6us 1s 10ms 42ms 42ms 2ms
# Lock time 31s 0 1s 327us 80us 11ms 22us
# Rows sent 69.36k 0 490 0.75 0.99 11.30 0
# Rows examine 196.34k 0 490 2.12 0.99 21.03 0.99
# Rows affecte 55.28k 0 15 0.60 0.99 1.26 0
# Bytes sent 13.12M 11 6.08k 144.93 299.03 219.02 51.63
# Query size 15.11M 5 922 166.86 258.32 83.13 174.84
Queryprofilering op basis van rangorde
U kunt nuttige informatie zien in de profileringsquery.
# Profile
# Rank Query ID Response time Calls R/Call V/M Ite
# ==== ============================= ============== ===== ====== ===== ===
# 1 0xCE367F5CFFCAF46E816F682E... 162.6485 17.1% 199 0.8173 0.03 SELECT order_line? stock?
# 2 0x360F872745C81781F8F75EDE... 107.4898 11.3% 14837 0.0072 0.02 SELECT stock?
Er is veel informatie, zoals de uitgevoerde query's, de responstijd van de query (inclusief de percentageberekening), het aantal oproepen dat de query maakt en het aantal leesbewerkingen per oproep.
Query-distributie
Statistieken voor querydistributie beschrijven gedetailleerde informatie op basis van de rangschikking van queryprofilering, u kunt de QPS-gelijktijdigheid zien, statistische informatie met betrekking tot het querykenmerk.
# Query 1: 6.03 QPS, 4.93x concurrency, ID 0xCE367F5CFFCAF46E816F682E53C0CF03 at byte 30449473
# This item is included in the report because it matches --limit.
# Scores: V/M = 0.03
# Time range: 2020-05-10 21:39:37 to 21:40:10
# Attribute pct total min max avg 95% stddev median
# ============ === ======= ======= ======= ======= ======= ======= =======
# Count 0 199
# Exec time 17 163s 302ms 1s 817ms 992ms 164ms 816ms
# Lock time 0 9ms 30us 114us 44us 84us 18us 36us
# Rows sent 0 199 1 1 1 1 0 1
# Rows examine 39 76.91k 306 468 395.75 441.81 27.41 381.65
# Rows affecte 0 0 0 0 0 0 0 0
# Bytes sent 0 15.54k 79 80 79.96 76.28 0 76.28
# Query size 0 74.30k 382 384 382.35 381.65 0 381.65
# String:
# Databases sbt
# Hosts localhost
# Last errno 0
# Users sbtest
# Query_time distribution
# 1us
# 10us
# 100us
# 1ms
# 10ms
# 100ms ################################################################
# 1s ####
# 10s+
# Tables
# SHOW TABLE STATUS FROM `sbt` LIKE 'order_line6'\G
# SHOW CREATE TABLE `sbt`.`order_line6`\G
# SHOW TABLE STATUS FROM `sbt` LIKE 'stock6'\G
# SHOW CREATE TABLE `sbt`.`stock6`\G
# EXPLAIN /*!50100 PARTITIONS*/
SELECT COUNT(DISTINCT (s_i_id))
FROM order_line6, stock6
WHERE ol_w_id = 1
AND ol_d_id = 1
AND ol_o_id < 3050
AND ol_o_id >= 3030
AND s_w_id= 1
AND s_i_id=ol_i_id
AND s_quantity < 18\G
Er is ook informatie over de distributie van querytijd, host, gebruiker en database.
Querybewaking met ClusterControl
ClusterControl heeft een Query Monitoring-functie die u kunt vinden op het tabblad Query Monitor, zoals hieronder weergegeven.
U kunt informatie zien met betrekking tot de query die in de database wordt uitgevoerd, inclusief statistische informatie en uitvoeringstijd. U kunt ook de Query Monitor-instelling configureren die nog steeds op dezelfde pagina staat. Er is een optie om de langzame zoekopdracht en zoekopdrachten die geen index gebruiken in te schakelen door op Instellingen te klikken
U hoeft alleen de Long Query Time in te stellen, de drempel van de query die lang categoriseert op basis van uitvoeringstijd. Er is ook een optie om de zoekopdracht in te schakelen die geen indexen gebruikt.
Conclusie
Het monitoren en analyseren van de querywerkbelasting kan nuttig zijn, zodat u uw databasewerkbelasting kent en begrijpt. Zowel pt-query-digest als de ClusterControl Query Monitor bieden informatie met betrekking tot de query die in de database wordt uitgevoerd om u te helpen dat inzicht te krijgen.