怎么解決mysqlsleep線程過(guò)多的問(wèn)題?
在MySQL 8.0 之前, 我們假設(shè)一下有一條爛SQL,
mysqlselect * from t1 order by rand() ;以多個(gè)線程在跑,導(dǎo)致CPU被跑滿了,其他的請(qǐng)求只能被阻塞進(jìn)不來(lái)。那這種情況怎么辦?
大概有以下幾種解決辦法:
設(shè)置max_execution_time 來(lái)阻止太長(zhǎng)的讀SQL。那可能存在的問(wèn)題是會(huì)把所有長(zhǎng)SQL都給KILL 掉。有些必須要執(zhí)行很長(zhǎng)時(shí)間的也會(huì)被誤殺。自己寫(xiě)個(gè)腳本檢測(cè)這類語(yǔ)句,比如order by rand(), 超過(guò)一定時(shí)間用Kill query thread_id 給殺掉。那能不能不要?dú)⒌舳屗_\(yùn)行,但是又不影響其他的請(qǐng)求呢?
那mysql 8.0 引入的資源組(resource group,后面簡(jiǎn)寫(xiě)微RG)可以基本上解決這類問(wèn)題。
比如我可以用 RG 來(lái)在SQL層面給他限制在特定的一個(gè)CPU核上,這樣我就不管他,讓他繼續(xù)運(yùn)行,如果有新的此類語(yǔ)句,讓他排隊(duì)好了。
為什么說(shuō)基本呢?目前只能綁定CPU資源,其他的暫時(shí)不行。
那我來(lái)演示下如何使用RG。
創(chuàng)建一個(gè)資源組user_ytt. 這里解釋下各個(gè)參數(shù)的含義,
type = user 表示這是一個(gè)用戶態(tài)線程,也就是前臺(tái)的請(qǐng)求線程。如果type=system,表示后臺(tái)線程,用來(lái)限制mysql自己的線程,比如Innodb purge thread,innodb read thread等等。vcpu 代表cpu的邏輯核數(shù),這里0-1代表前兩個(gè)核被綁定到這個(gè)RG。可以用lscpu,top等列出自己的CPU相關(guān)信息。thread_priority 設(shè)置優(yōu)先級(jí)。user 級(jí)優(yōu)先級(jí)設(shè)置大于0。mysqlmysql> create resource group user_ytt type = user vcpu = 0-1 thread_priority=19 enable;Query OK, 0 rows affected (0.03 sec)RG相關(guān)信息可以從 information_schema.resource_groups 系統(tǒng)表里檢索。
mysqlmysql> select * from information_schema.resource_groups;+---------------------+---------------------+------------------------+----------+-----------------+| RESOURCE_GROUP_NAME | RESOURCE_GROUP_TYPE | RESOURCE_GROUP_ENABLED | VCPU_IDS | THREAD_PRIORITY |+---------------------+---------------------+------------------------+----------+-----------------+| USR_default | USER | 1 | 0-3 | 0 || SYS_default | SYSTEM | 1 | 0-3 | 0 || user_ytt | USER | 1 | 0-1 | 19 |+---------------------+---------------------+------------------------+----------+-----------------+3 rows in set (0.00 sec)我們來(lái)給語(yǔ)句select guid from t1 group by left(guid,8) order by rand() 賦予RG user_ytt。
mysql> show processlist;+-----+-----------------+-----------+------+---------+-------+------------------------+-----------------------------------------------------------+| Id | User | Host | db | Command | Time | State | Info |+-----+-----------------+-----------+------+---------+-------+------------------------+-----------------------------------------------------------+| 4 | event_scheduler | localhost | NULL | Daemon | 10179 | Waiting on empty queue | NULL || 240 | root | localhost | ytt | Query | 101 | Creating sort index | select guid from t1 group by left(guid,8) order by rand() || 245 | root | localhost | ytt | Query | 0 | starting | show processlist |+-----+-----------------+-----------+------+---------+-------+------------------------+-----------------------------------------------------------+3 rows in set (0.00 sec)找到連接240對(duì)應(yīng)的thread_id。
mysqlmysql> select thread_id from performance_schema.threads where processlist_id = 240;+-----------+| thread_id |+-----------+| 278 |+-----------+1 row in set (0.00 sec)給這個(gè)線程278賦予RG user_ytt。沒(méi)報(bào)錯(cuò)就算成功了。
mysqlmysql> set resource group user_ytt for 278;Query OK, 0 rows affected (0.00 sec)當(dāng)然這個(gè)是在運(yùn)維層面來(lái)做的,我們也可以在開(kāi)發(fā)層面結(jié)合 MYSQL HINT 來(lái)單獨(dú)給這個(gè)語(yǔ)句賦予RG。比如:
mysqlmysql> select /*+ resource_group(user_ytt) */guid from t1 group by left(guid,8) order by rand()....8388602 rows in set (4 min 46.09 sec)RG的限制:
Linux 平臺(tái)上需要開(kāi)啟 CAPSYSNICE 特性。比如我機(jī)器上用systemd 給mysql 服務(wù)加上systemctl edit mysql@80 [Service]AmbientCapabilities=CAP_SYS_NICEmysql 線程池開(kāi)啟后RG失效。freebsd,solaris 平臺(tái)thread_priority 失效。目前只能綁定CPU,不能綁定其他資源。