判断是否需要copy data
https://www.cnblogs.com/zuoxingyu/archive/2013/03/28/2986715.html
https://www.cnblogs.com/wangtao_20/p/3504395.html
//DDL语句执行表复制的逻辑
根据原表A创建临时表B
在临时表B上执行DDL语句
对表A加table lock(lock是加载mysql Server上的)
复制表A的数据到表B
drop tb A;
rename B to A;
unlock tb A;
执行DDL语句时,观察执行结果中rows affected是否大于0,大于0表示存在表复制。
mysql> alter table t1 add index idx_a(a);
Query OK, 0 rows affected (0.43 sec)
Records: 0 Duplicates: 0 Warnings: 0
mysql> alter table t1 change a a_new int;
Query OK, 0 rows affected (0.20 sec)
Records: 0 Duplicates: 0 Warnings: 0
mysql> alter table t1 add column b int;
Query OK, 0 rows affected (0.84 sec)
Records: 0 Duplicates: 0 Warnings: 0
mysql> alter table t1 alter b set default 1;
Query OK, 0 rows affected (0.08 sec)
Records: 0 Duplicates: 0 Warnings: 0
//修改表字段类型需要copy data
mysql> alter table city modify column Name varchar(64);
Query OK, 4079 rows affected (0.68 sec)
Records: 4079 Duplicates: 0 Warnings: 0
copy&inPlace&Rebuild说明
Operation | In Place | Rebuilds Table | Permits Concurrent DML | Only Modifies Metadata
Adding a column | Yes | Yes | Yes*| No
Dropping a column | Yes | Yes | Yes | No
Renaming a column | Yes | No|Yes*|Yes
Reordering columns|Yes |Yes |Yes |No
Setting a column default value |Yes |No |Yes |Yes
Changing the column data type |No |Yes |No |No
Extending VARCHAR column size |Yes |No |Yes |Yes
Dropping the column default value |Yes |No |Yes |Yes
Changing the auto-increment value |Yes |No |Yes |No*
Making a column NULL |Yes |Yes* |Yes |No
Making a column NOT NULL |Yes* |Yes* |Yes |No
Modifying the definition of an ENUM or SET column |Yes |No |Yes |Yes
修改字段类型需要copy data,成本很高,务必在表设计时要慎重;其余像add column无需copy但需要Rebuild table,可能也比较耗时,建议在测试环境模拟看是否会超过事务超时时间,评估影响。假如时间较长,可以采用如下思路:
- pt-online-schema-change
创建临时表
在旧表创建触发器
旧表复制到新表
触发器记录上一步过程中发生的数据变更
应用变更到新表
- binlog追加方式
相比上面使用触发器记录更新的方式,会增加原表的负载,个人感觉用binlog更好。
创建临时表
记录binlog序列号t1,从旧表全表数据复制(快照读,jdbc流式读取或insert xx select from)
全表复制完成后,开始从t1获取之后的binlog追加到临时表中,此步骤需要考虑记录时间t1到复制开始时间中间新提交的事务造成的重复数据(delete\update幂等,insert追加时会报重复行,此时获取追加失败的记录,改用replace处理),追加到某个binlog序列号t2,此时已无更新的binlog了
加write lock
从t2开始追加更新的binlog
追加完成后rename新旧表
释放write lock