在一主一备的双M架构里,主备切换只需要把客户端流量切换到备库;
而在一主多从架构里,主备切换除了要把客户端流量切到备库外,还需要把从库连接到新主库上。
主备切换有两种场景,一种是主动切换,一种是被动切换。而其中被动切换,往往是因为主库出问题了,由HA系统发起的。
如何判断一个数据库是否出问题?
select 1判断
select 1 成功返回,只能说明这个库的经进程,并不能说明主库没问题。
这里需要明确并发连接和并发查询的区别:
show processlist,看到的几千个链接,指的就是并发连接;而“当前正在执行”的语句,才是并发查询。
并发连接数达到几千个影响并不大,就是多占用一些内存而已,应该关注的是并发查询,因为并发查询太高才是CPU杀手。这也是为什么需要设置innodb_thread_concurrency参数的原因。
查表判断
为了能够检测InnoDB并发线程数过多导致的系统不可用情况,需要找一个访问InnoDB的场景,一般的做法是,在系统库里创建一个表,比如命名为health_check,里面只放一行数据,然后定期执行。
使用这个方法,可以检测出由于并发线程过多导致的数据库不可用的情况;
但空间满了以后,这种方法又会变得不好使了。
我们知道,更新食物要写binlog,而一旦binlog所在磁盘的空间占用率达到100%,那么所有的更新语句和事物提交的commit语句就都会被堵住,但是系统这时候是可以正常读数据的。
更新判断
通常做法是放一个timestamp字段,用来表示最后一次执行检测的时间:
mysql> update mysql.health_check set t_modified=now();
节点可用性的检测都应该包含主库和备库。如果用更新来检测主库的话,那么备库也要进行更新检测。但,悲苦的检测也是要写binlog的,所以表就不能只有一行数据了。
为了让主备之间的更新不产生冲突,在表上存入多行数据,并用A\B的server_id做主键
mysql> CREATE TABLE `health_check` ( `id` int(11) NOT NULL, `t_modified` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, PRIMARY KEY (`id`)) ENGINE=InnoDB;
/* 检测命令 */
insert into mysql.health_check(id, t_modified) values (@@server_id, now()) on duplicate key update t_modified=now();
内部统计
针对磁盘利用率这个问题,如果MySQL可以告诉我们,内部每一次IO请求的时间,那判断数据库是否出问题的方法就可靠得多了。