這篇文章主要為大家展示了“中主鍵與rowid的使用陷阱有哪些”,內容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習一下“MySQL中主鍵與rowid的使用陷阱有哪些”這篇文章吧。
前言
大家在MySQL中我們可能聽(tīng)到過(guò)rowid的概念,但是卻很難去測試實(shí)踐,不可避免會(huì )有一些疑惑,比如:
如何感受到rowid的存在;
rowid和主鍵有什么關(guān)聯(lián)關(guān)系;
在主鍵的使用中存在哪些隱患;
如何來(lái)理解rowid的潛在瓶頸并調試驗證。
本文要和大家一起討論這幾個(gè)問(wèn)題,測試的環(huán)境基于MySQL 5.7.19版本。
問(wèn)題1、如何感受到rowid的存在
我們不妨通過(guò)一個(gè)案例來(lái)進(jìn)行說(shuō)明。
記得有一天統計備份數據的時(shí)候,寫(xiě)了一條SQL,當看到執行結果時(shí)才發(fā)現SQL語(yǔ)句沒(méi)有寫(xiě)完整,在完成統計工作之后,我準備分析下這條SQL語(yǔ)句。
mysql> select backup_date ,count(*) piece_no from _backup_result; +-------------+----------+ | backup_date | piece_no | +-------------+----------+ | 2018-08-14 | 40906 | +-------------+----------+ 1 row in set (0.03 sec)
根據業(yè)務(wù)特點(diǎn),一天之內肯定沒(méi)有這么多的記錄,明顯不對,到底是哪里出了問(wèn)題呢。
自己仔細看了下SQL,發(fā)現是沒(méi)有加group by,我們隨機查出10條數據。
mysql> select backup_date from redis_backup_result limit 10; +-------------+ | backup_date | +-------------+ | 2018-08-14 | | 2018-08-14 | | 2018-08-14 | | 2018-08-15 | | 2018-08-15 | | 2018-08-15 | | 2018-08-15 | | 2018-08-15 | | 2018-08-15 | | 2018-08-15 | +-------------+ 10 rows in set (0.00 sec)
在早期的版本中數據庫參數sql_mode默認為空,不會(huì )校驗這個(gè)部分,從語(yǔ)法角度來(lái)說(shuō),是允許的;但是到了高版本,比如5.7版本之后是不支持的,所以解決方案很簡(jiǎn)單,在添加group by之后,結果就符合預期了。
mysql> select backup_date ,count(*) piece_no from redis_backup_result group by backup_date; +-------------+----------+ | backup_date | piece_no | +-------------+----------+ | 2018-08-14 | 3 | | 2018-08-15 | 121 | | 2018-08-16 | 184 | | 2018-08-17 | 3284 | | 2018-08-18 | 7272 | | 2018-08-19 | 7272 | | 2018-08-20 | 7272 | | 2018-08-21 | 7272 | | 2018-08-22 | 8226 | +-------------+----------+ 9 rows in set (0.06 sec)
但是比較好奇這個(gè)解析的邏輯,看起來(lái)是SQL解析了第一行,然后輸出了count(*)的操作,顯然這是從執行計劃中無(wú)法得到的信息。
我們換個(gè)思路,可以看到這個(gè)表有4萬(wàn)多條的記錄。
mysql> select count(*)from redis_backup_result; +----------+ | count(*) | +----------+ | 40944 | +----------+ 1 row in set (0.01 sec)
為了驗證,我們可以使用_rowid的方式來(lái)做初步的驗證。
InnoDB表中在沒(méi)有默認主鍵的情況下會(huì )生成一個(gè)6字節空間的自動(dòng)增長(cháng)主鍵,可以用select _rowid from table來(lái)查詢(xún),如下:
mysql> select _rowid from redis_backup_result limit 5; +--------+ | _rowid | +--------+ | 117 | | 118 | | 119 | | 120 | | 121 | +--------+ 5 rows in set (0.00 sec)
再可以實(shí)現一個(gè)初步的思路。
mysql> select _rowid,count(*)from redis_backup_result; +--------+----------+ | _rowid | count(*) | +--------+----------+ | 117 | 41036 | +--------+----------+ 1 row in set (0.03 sec)
然后繼續升華一些,借助rownum來(lái)實(shí)現,當然在MySQL中原生不支持這個(gè)特性,需要間接實(shí)現。
mysql> SELECT @rowno:=@rowno+1 as rowno,r._rowid from redis_backup_result r ,(select @rowno:=0) t limit 20; +-------+--------+ | rowno | _rowid | +-------+--------+ | 1 | 117 | | 2 | 118 | | 3 | 119 | | 4 | 120 | | 5 | 121 | | 6 | 122 | | 7 | 123 | | 8 | 124 | | 9 | 125 | | 10 | 126 | | 11 | 127 | | 12 | 128 | | 13 | 129 | | 14 | 130 | | 15 | 131 | | 16 | 132 | | 17 | 133 | | 18 | 134 | | 19 | 135 | | 20 | 136 | +-------+--------+ 20 rows in set (0.00 sec)
寫(xiě)一個(gè)完整的語(yǔ)句,如下:
mysql> SELECT @rowno:=@rowno+1 as rowno,r._rowid ,backup_date,count(*) from redis_backup_result r ,(select @rowno:=0) t ; +-------+--------+-------------+----------+ | rowno | _rowid | backup_date | count(*) | +-------+--------+-------------+----------+ | 1 | 117 | 2018-08-14 | 41061 | +-------+--------+-------------+----------+ 1 row in set (0.02 sec)
通過(guò)這個(gè)案例,可以很明顯發(fā)現是第1行的記錄,然后做了count(*)的操作。
當然我們的目標是要掌握rowid和主鍵的一些關(guān)聯(lián)關(guān)系,所以我們也復盤(pán)一下主鍵使用中的隱患問(wèn)題。
問(wèn)題2、rowid和主鍵有什么關(guān)聯(lián)關(guān)系
在學(xué)習MySQL開(kāi)發(fā)規范之索引規范的時(shí)候,強調過(guò)一個(gè)要點(diǎn):每張表都建議有主鍵。我們在這里來(lái)簡(jiǎn)單分析一下為什么?
除了規范,從存儲方式上來(lái)說(shuō),在InnoDB存儲引擎中,表都是按照主鍵的順序進(jìn)行存放的,我們叫做聚簇索引表或者索引組織表(IOT),表中主鍵的參考依據如下:
顯式的創(chuàng )建主鍵Primary key。
判斷表中是否有非空唯一索引,如果有,則為主鍵。
如果都不符合上述條件,則會(huì )生成6個(gè)字節的bigint unsigned值。
從以上可以看到,MySQL對于主鍵有一套維護機制,而一些常見(jiàn)的索引也會(huì )產(chǎn)生相應的影響,比如唯一性索引、非唯一性索引、覆蓋索引等都是輔助索引(secondary index,也叫二級索引),從存儲的角度來(lái)說(shuō),二級索引列中默認包含主鍵列,如果主鍵太長(cháng),也會(huì )使得二級索引很占空間。
問(wèn)題3、在主鍵的使用中存在哪些隱患
這就引出行業(yè)里非常普遍的主鍵性能問(wèn)題,這不是一個(gè)單一的問(wèn)題,需要MySQL方向持續改造的,將技術(shù)價(jià)值和業(yè)務(wù)價(jià)值結合起來(lái)。我看到很多業(yè)務(wù)中設置了自增列,但是大多數情況下,這種自增列卻沒(méi)有實(shí)際的業(yè)務(wù)含義,盡管是主鍵列保證了ID的唯一性,但是業(yè)務(wù)開(kāi)發(fā)無(wú)法直接根據主鍵自增列來(lái)進(jìn)行查詢(xún),于是他們需要尋找新的業(yè)務(wù)屬性,添加一系列的唯一性索引,非唯一性索引等等,這樣一來(lái)我們堅持的規范和業(yè)務(wù)使用的方式就存在了偏差。
從另外一個(gè)維度來(lái)說(shuō),我們對于主鍵的理解是有偏差的,我們不能單一的認為主鍵就一定是從1開(kāi)始的整數類(lèi)型,我們需要結合業(yè)務(wù)場(chǎng)景來(lái)看待,比如我們的身份證其實(shí)就是一個(gè)不錯的例子,把證號分成了幾個(gè)區段,偏于檢索和維護;或者是外出就餐時(shí)得到的流水單號,它都有一定的業(yè)務(wù)屬性在里面,對于我們去理解業(yè)務(wù)的使用是一種不錯的借鑒。
問(wèn)題4、如何來(lái)理解rowid的潛在瓶頸并進(jìn)行調試驗證
我們知道rowid只有6個(gè)字節,因此最大值是2^48,所以一旦 row_id超過(guò)這個(gè)值還是會(huì )遞增,這種情況下是否存在隱患。
光說(shuō)不練假把式,我們可以做一個(gè)測試來(lái)說(shuō)明。
1)我們創(chuàng )建一張表test_inc,不包含任何索引。
create table test_inc(id int) engine=innodb;
2)通過(guò)ps -ef|grep mysql得到對應的進(jìn)程號,使用gdb來(lái)開(kāi)始做下調試配置,切記!此處應該是自己的測試環(huán)境。
[root@dev01 mysql]# gdb -p 3132 -ex 'p dict_sys->row_id=1' -batch [New LWP 3192] [New LWP 3160] [New LWP 3159] [New LWP 3158] [New LWP 3157] [New LWP 3156] [New LWP 3155] [New LWP 3154] [New LWP 3153] [New LWP 3152] [New LWP 3151] [New LWP 3150] [New LWP 3149] [New LWP 3148] [New LWP 3147] [New LWP 3144] [New LWP 3143] [New LWP 3142] [New LWP 3141] [New LWP 3140] [New LWP 3139] [New LWP 3138] [New LWP 3137] [New LWP 3136] [New LWP 3135] [New LWP 3134] [New LWP 3133] [Thread debugging using libthread_db enabled] 0x00000031ed8df283 in poll () from /lib64/libc.so.6 $1 = 1
3)我們做下基本檢驗,得到建表語(yǔ)句,保證測試是預期的樣子。
mysql> show create table test_inc\G *************************** 1. row *************************** Table: test_inc Create Table: CREATE TABLE `test_inc` ( `id` int(11) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8 1 row in set (0.00 sec)
4)插入一些數據,使得rowid持續自增。
mysql> insert into test_inc values(1),(2),(3); Query OK, 3 rows affected (0.08 sec) Records: 3 Duplicates: 0 Warnings: 0
5)我們對rowid進(jìn)行重置,調整為2^48
mysql> select power(2,48); +-----------------+ | power(2,48) | +-----------------+ | 281474976710656 | +-----------------+ 1 row in set (0.00 sec) [root@dev01 mysql]# gdb -p 3132 -ex 'p dict_sys->row_id=281474976710656' -batch 。。。 。。。 [Thread debugging using libthread_db enabled] 0x00000031ed8df283 in poll () from /lib64/libc.so.6 $1 = 281474976710656
6)繼續寫(xiě)入一些數據,比如我們寫(xiě)入4,5,6三行數據。
mysql> insert into test_inc values(4),(5),(6); Query OK, 3 rows affected (0.07 sec) Records: 3 Duplicates: 0 Warnings: 0
7)查看數據結果,發(fā)現1,2兩行已經(jīng)被覆蓋了。
mysql> select *from test_inc; +------+ | id | +------+ | 4 | | 5 | | 6 | | 3 | +------+ 4 rows in set (0.00 sec)
由此,我們可以看到rowid自增后,還是存在使用瓶頸,當然這個(gè)概率是很低的,需要自增列的值到281萬(wàn)億,這是一個(gè)相當龐大的數值了,從功能上來(lái)說(shuō),應該拋出寫(xiě)入重復值的錯誤更為合理。
而有了主鍵之后,上面這個(gè)瓶頸似乎就不存在了。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站