一文聊聊MySQL中的自增主键
MySQL中的自增主键是非常常见的一种字段类型,通常用于标识每行数据的唯一性。在实际使用中,自增主键可能会出现一些问题,今天我们就来聊一聊MySQL中的自增主键。
一、自增值保存在哪儿?
不同的引擎对于自增值的保存策略不同:
1. MyISAM引擎的自增值保存在数据文件中;
2. InnoDB引擎的自增值,在MySQL5.7及之前的版本,自增值保存在内存里,并没有持久化。每次重启后,第一次打开表的时候,都会去找自增值的最大值max(id),然后将max(id)+步长作为这个表当前的自增值select max(ai_col)from table_name for update;登录后复制在MySQL8.0版本,将自增值的变更记录在了redolog中,重启的时候依靠redolog恢复重启之前的值。
二、自增值修改机制
如果字段id被定义为AUTO_INCREMENT,在插入一行数据的时候,自增值的行为如下:
1. 如果插入数据时id字段指定为0、null或未指定值,那么就把这个表当前的AUTO_INCREMENT值填到自增字段;
2. 如果插入数据时id字段指定了具体的值,就直接使用语句里指定的值。假设,某次要插入的值是X,当前的自增值是Y
1. 如果X=Y,就需要把当前自增值修改为新的自增值。新的自增值生成算法是:从auto_increment_offset(初始值)开始,以auto_increment_increment(步长)为步长,持续叠加,直到找到第一个大于X的值,作为新的自增值。
三、自增值的修改时机
创建一个表t,其中id是自增主键字段、c是唯一索引,建表语句如下:
CREATE TABLE `t`(
`id` int(11)NOT NULL AUTO_INCREMENT,
`c` int(11)DEFAULT NULL,
`d` int(11)DEFAULT NULL,
PRIMARY KEY(`id`),
UNIQUE KEY `c`(`c`)
) ENGINE=InnoDB;
假设,表t里面已经有了(1,1,1)这条记录,这时再执行一条插入数据命令:INSERT INTO t VALUES(null,1,1);登录后复制执行流程如下:
1. 执行器调用InnoDB引擎接口写入一行,传入的这一行的值是(0,1,1);
2. InnoDB发现用于没有指定自增id的值,获取表t当前的自增值;
3. 将传入的行的值改成(2,1,1);
4. 将表的自增值改成3;
5. 继续执行插入数据操作,由于已经存在c=1的记录,所以报Duplicate key error(唯一键冲突),语句返回。
对应的执行流程图如下:
在这之后,再插入新的数据行时,拿到的自增id就是3。出现了自增主键不连续的情况,唯一键冲突和事务回滚都会导致自增主键id不连续的情况。
四、自增锁的优化
自增id锁并不是一个事务锁,而是每次申请完就马上释放,以便允许别的事务再申请。但在MySQL5.0版本的时候,自增锁的范围是语句级别。也就是说,如果一个语句申请了一个表自增锁,这个锁会等语句执行结束以后才释放。
MySQL5.1.22版本引入了一个新策略,新增参数innodb_autoinc_lock_mode,默认值是1
1. 这个参数设置为0,表示采用之前MySQL5.0版本的策略,即语句执行结束后才释放锁;
2. 这个参数设置为1,普通insert语句,自增锁在申请之后就马上释放;类似insert…select这样的批量插入数据的语句,自增锁还是要等语句结束后才被释放;
3. 这个参数设置为2,所有的申请自增主键的动作都是申请后就释放锁。为了数据的一致性,默认设置为1。
如果sessionB申请了自增值以后马上就释放自增锁,那么就可能出现这样的情况:sessionB先插入了两行数据(1,1,1)、(2,2,2),sessionA来申请自增id得到id=3,插入了(3,5,5)之后,sessionB继续执行,插入两条记录(4,3,3)、(5,4,4)。
当binlog_format=statement的时候,两个session是同时执行插入数据命令的,所以binlog里面对表t2的更新日志只有两种情况:要么先记sessionA的,要么先记录sessionB的。无论是哪一种,这个binlog拿到从库执行,或者用来恢复临时实例,备库和临时实例里面,sessionB这个语句执行出来,生成的结果里面,id都是连续的。这时,这个库就发生了数据不一致。
解决这个问题的思路:
1. 让原库的批量插入数据语句,固定生成连续的id值。所以,自增锁直到语句执行结束才释放,就是为了达到这个目的。
2. 在binlog里面把插入数据的操作都如实记录进来,到备库执行的时候,不再依赖于自增主键去生成。也就是把innodb_autoinc_lock_mode设置为2,同时binlog_format设置为row。
如果有批量插入数据(insert…select、replace…select和load data)的场景时,从并发插入数据性能的角度考虑,建议把innodb_autoinc_lock_mode设置为2,同时binlog_format设置为row,这样做既能并发性,又不会出现数据一致性的问题。
对于批量插入数据的语句,MySQL有一个批量申请自增id的策略:
1. 语句执行过程中,第一次申请自增id,会分配1个;
2. 1个用完以后,这个语句第二次申请自增id,会分配2个;
3. 2个用完以后,还是这个语句,第三次申请自增id,会分配4个;
4

-
MySQL Workbench怎么建立数据库(附:sql语句创建数据库方法) 2023-07-20 12:22:29
-
MySQL Workbench是什么?(附:如何设置中文教程) 2023-07-20 11:42:31
-
mysql乐观锁和悲观锁的区别是什么 2023-05-14 07:00:03
-
一起聊聊MySQL主从延时的处理方案 2023-05-14 07:00:03
-
mysql修改表结构的语句是什么 2023-05-14 07:00:03
-
mysql驱动是什么 2023-05-14 07:00:03
-
MySQL 语法整理介绍 2023-05-14 07:00:03
-
qt5.8如何连接mysql 2023-05-14 07:00:03
-
mysql怎么将查询结果赋给变量 2023-05-14 07:00:03
-
mysql怎样防止sql注入问题 2023-05-14 07:00:02