开发对于数据库的了解可不能局限于CURD,数据库的技能复杂度也不是仅仅写几个复杂的sql语句,这个Mysql系列就是对数据库由浅到深的总结。
一、基础概念
myisam 和 innodb的区别吗?
myisam引擎是5.1版本之前的默认引擎,支持全文检索、压缩、空间函数等,但是不支持事务和行级锁,所以一般用于有大量查询少量插入的场景来使用,而且myisam不支持外键,并且索引和数据是分开存储的。系统奔溃后,MyISAM恢复起来很困难。
innodb是基于聚簇索引建立的,和myisam相反它支持事务、外键,并且通过MVCC来支持高并发,索引和数据存储在一起。
说了很多,最需要记住的InnoDB不同于MyISAM最大的两个特点就是:一是支持事务,二是支持行锁;毋庸置疑,因为这两个特性大部分都采用InnoDB引擎,其中的支持行锁就是InnoDB适合多并发优势所在,这个在第三篇锁和事务会重点讲到的。
mysql的索引有哪些,聚簇和非聚簇索引又是什么?
索引按照数据结构来说主要包含B+树和Hash索引。
- 主键索引的叶子节点存的是整行数据。在 InnoDB 里,主键索引也被称为聚簇索引(clustered index)。
- 非主键索引的叶子节点内容是主键的值。在 InnoDB 里,非主键索引也被称为二级索引(secondary index)。
聚簇索引查询相对会更快一些,因为主键索引树的叶子节点直接就是我们要查询的整行数据了。而非主键索引的叶子节点是主键的值,查到主键的值以后,还需要再通过主键的值再进行一次查询(这个过程叫做回表, 也就是查了两个索引树)。
什么是覆盖索引和回表吗?
回表就是先通过数据库索引扫描出数据所在的行,再通过行主键id取出索引中未提供的数据,即基于非主键索引的查询需要多扫描一棵索引树。
如果一个索引包含(或者说覆盖)所有需要查询的字段的值,我们就称之为“覆盖索引”。我们知道InnoDB存储引擎中,如果不是主键索引,叶子节点存储的是主键+列值。最终还是要“回表”,也就是要通过主键再查找一次。这样就会比较慢覆盖索引就是把要查询出的列和索引是对应的,不做回表操作!
而要确定一个查询是否是覆盖索引,我们只需要explain sql语句看Extra的结果是否是“Using index”即可。
最左前缀原则
对多个字段同时建立的索引(有顺序,ABC,ACB是完全不同的两种联合索引。)以联合索引(a,b,c)为例,建立这样的索引相当于建立了索引a、ab、abc三个索引。
所以在建立联合索引的时候,如何安排索引内的字段顺序?
这里我们的评估标准是,索引的复用能力。因为可以支持最左前缀,所以当已经有了 (a,b) 这个联合索引后,一般就不需要单独在 a 上建立索引了。因此,第一原则是,如果通过调整顺序,可以少维护一个索引,那么这个顺序往往就是需要优先考虑采用的。
索引下推
MySQL 5.6引入了索引下推优化,可以在索引遍历过程中,对索引中包含的字段先做判断,过滤掉不符合条件的记录,减少回表字数。
如果没有索引下推优化(或称ICP优化),当进行索引查询时,首先根据索引来查找记录,然后再根据where条件来过滤记录;在支持ICP优化后,MySQL会在取出索引的同时,判断是否可以进行where条件过滤再进行索引查询,也就是说提前执行where的部分过滤操作,在某些场景下,可以大大减少回表次数,从而提升整体性能
二、Mysql架构与原理
Mysql的架构图
Server层四大组件:连接器,解析器,优化器和执行器。
存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持 InnoDB、MyISAM
Mysql的数据更新流程
1、加载磁盘文件到buffer Pool中;
2、更新数据之前,写入旧数据到undo日志,便于回退;
3、更新内存中的buffer pool数据;
4、将更新部分的redo log写入到redo log buffer中;
5、redo日志刷入磁盘
6、binlog日志刷入磁盘
7、将binlog文件和位置写入到redo日志文件中,并写入commit。
8、后台的IO线程某个时间随机将buffer pool中的脏数据同步到磁盘文件。
Mysql架构这一部分已经在另外一篇博客里Mysql篇之架构设计做了详细的讲解了。