一、MySql 基础架构
目录
[toc]
1.1Mysql逻辑架构
如上图:
展示了mysql逻辑的架构图。
- 最上层:处理一些连接,授权认证和安全等。
- 第二层:包含了查询缓存,解析器和优化器。大多数的核心服务功能都在这一层,包括查询解析、分析、优化、缓存以及所有的内置函数,还有一些跨存储引擎的功能都在这一层实现:存储过程、触发器、视图等。
- 第三层:包含了存储引擎。主要负责的是数据的存储和提取。mysql支持很多引擎,每个引擎都有它的优势和劣势。存储引擎API包含了几十个底层函数,用于执行诸如“开始一个事务”或者“根据主键提取一行记录”等操作。但它不会解析SQL,不同存储引擎之间也不会相互通信,而只是简单的响应上层服务器的请求。
1.1.1 连接管理与安全
每个客户端连接都会在服务器进程中拥有一个线程,这个连接的查询只会在这个单独的线程中执行,该线程只能轮流在某个CPU核心或者CPU中运行。服务器会缓存线程,因此不需要为每个新建的连接创建或者销毁线程。当客户端连接mysql服务器时,服务器需要对其进行认证。
1.1.2 优化与执行
Mysql会解析查询,并创建内部数据结构(解析树),然后对其进行各种优化,包括重写查询、决定表的读取顺序,以及选择合适的索引等。用户可以通过特殊的关键字提示(hint)优化器,影响他的决策过程。也可以请求优化器解释(explain)优化过程的各个因素,让用户可以知道服务器是如何进行优化决策的。
- 特殊的关键字提示(hint)优化器 SELECT select_list FROM table_name USE INDEX(index_list) WHERE condition;
- 优化器并不关心使用的是什么存储引擎,但存储引擎对于优化查询还是有影响的。
- 对于SELECT语句,在解析查询之前,服务器会优先检查查询缓存,如果能够在其中找到对应的查询,服务器就不必再执行解析、优化和执行的整个过程,惹事直接返回结果集。
1.2 并发控制
只要有多个查询需要在同一时刻中修改数据,都会产生并发控制的问题。大多数系统,都会利用锁机制来解决这些问题。
1.2.1 读写锁
在处理并发读或者写时,可以通过一个由两种类型的锁组成的锁系统来解决问题。这两种类型的锁通常被称为共享锁和排他锁。也叫读锁和写锁。
读锁是共享的,或者说是相互不阻塞的。多个客户在同一时刻同时读取同一个资源而不会相互干扰。而些许哦是排他的,也就是说一个写锁会阻塞其他的写锁或者读锁,这是出于安全策略的考虑,这样可以保证只有一个用户执行写入,并防止其他晕乎读取正在写入的同一资源而发生错误的结果。
1.2.2 锁粒度
- 表锁:表锁是mysql中最基本的锁策略,并且是锁开销最小的策略。因为锁越多,代表着越要消耗资源,所得各种操作,包括获得锁,检查锁是否已经解除,释放锁等,都会增加系统开销。表锁会锁定整张表。一个用户对表进行写操作前(插入、删除和更新),需要先获取写锁,这回阻塞用户对改变的所有读写操作。知识没有写锁时,其他读取的用户才能获取读锁,读锁之间是不相互阻塞的。
- 行锁:行锁可以最大程度的支持并发处理(同时也带来了最大的锁开销)。InnoDbB和XtraDB实现了行锁。行级锁只在存储引擎实现,而mysql服务器层没有实现。
1.3 事务
事务就是一组原子性的SQL操作,或者说是一个独立的工作单元。如果数据库引擎能够成功地对数据库应用该组的全部语句,那么就执行。如果其中任何一条语句因为崩溃或者其他原因无法执行,那么所有的语句都不会执行。也就是说:事务内的语句,要么全部执行成功,要么全部执行失败。
1.3.1 事务的特性(ACID)
- 原子性(atomicity)一个事务必须视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部成功,要么全部失败回滚,对于一个事务来说,不可能只执行其中的某一部分操作。
- 一致性(consistency)数据库总是从一个一致性的状态转换到另一个一致性的状态。假如事务没有提交,所有事务中所做的修改也不会保存到数据库中。
- 隔离性(isolation)一个事务所做的修改,在最终提交之前,对其他事务是不可见的。
- 持久性(durability)一旦事务提交,则其所做的改变就会永久的保存于数据库中。此时,即使数据库崩溃,数据也不会丢失。
1.3.2 隔离级别
针对隔离性,衍生出了隔离级别的概念,因为它复杂的多。在SQL标准中,定义了四种隔离级别。较为低级的隔离级别通常可以执行更高的并发,系统的开销也更低。
- 读未提交(READ UNCOMMITTED)指的是事务中的修改,即使没有提交,对其他事务也都是可见的。事务可以读取到未提交的数据,这也被称为脏读。
- 读已提交(READ COMMITTED)一个事务开始时,只能“看见”已经提交的事务所做的修改。解决了脏读的问题,但是它也被叫做不可重复读,因为两次执行同样的查询,可能会得到不一样的结果。
- 可重复读(REPEATABLE READ)Mysql默认隔离级别。解决了不可重复读和脏读的问题。该级别保证了在同一个事务中多次读取同样的记录的结果是一致的。但是,它无法解决幻读的问题。所谓幻读,就是指当某个事务在读取范围内的记录时,另一个事务又在该范围内插入了新的记录,当之前的事务再次读取该范围的记录时,可能会产生幻行。innoDB通过多版本并发控制(MVCC)解决了幻读的问题。
- 可串行化(SERIALIZABLE)最高的隔离级别。它让事务串行的执行,避免了幻读的问题。它会在读取的每一行数据都加锁,所以可能会导致大量的锁竞争和超时的问题。性能 最差。
1.3.3 死锁
死锁是指两个或者多个事务在同一资源相互占用,并请求锁定对方占用的资源,从而导致恶性循环的现象。当多个事务试图以不同的顺序锁定资源时,就可能会产生死锁。多个事务同时锁定同一个资源,也会产生死锁。
为了解决死锁的问题,数据库系统实现了各种死锁检测和死锁超时机制。比如InnoDB,能检测到死锁的循环依赖,将持有的最少行级排他锁的事务进行回滚。死锁发生以后,只有部分或者完全回滚其中一个事务,才能打破死锁。
1.3.4 Mysql中的事务
Mysql提供了两种事务型的存储引擎,InnoDB和NDB Cluseter. mysql中的事务有以下特点:
- 自动提交。mysql默认采用自动提交的方式。如果不显式地开始一个事务,则每个查询都被当做一个事务执行提交操作。
- 隐式和显式锁定。InnoDB采用的是两阶段锁定协议。在事务执行过程中,随时都可以执行锁定,锁只有在执行了commit或者rollback后才会释放,并且所有的锁是在同一时刻被释放。
SELECT ... LOCK IN SHARE MODE
SELECT ... FOR UPDATE
Mysql中以上了两种特定的语句,可以进行显式锁定。
1.4多版本并发控制(MVCC)
MVCC是行级锁的一种变种,但是它在很多情况下避免了加锁的操作,因此开销更低。InnoDB中的MVCC,是通过在每行记录中保存了两个隐藏的列来实现的。这两个列,一个保存了行的创建时间,另一个保存的是过期时间(或删除时间)。不是存储的实际的时间值,而是版本号。每开始一个新的事务,系统版本号都会自动递增。事务开始时刻的系统版本号作为事务的版本号,用来和查询到的每行记录的版本号进行比较。
MVCC的基本原理是:在事务中保存数据的快照,这意味着在一个事物里能够看到数据一致的视图,而不用担心这个事务运行多长时间,同时也意味着在同一个时刻不同事务看到的相同表里的数据可能是不同的。
MVCC的基本特征:
- 每行数据都存在一个版本,每次数据更新时都更新该版本
- 修改时Copy出当前版本随意修改,各个事务之间无干扰
- 保存时比较版本号,如果成功(commit),则覆盖原记录;失败则放弃copy(rollback)
InnoDB存储引擎MVCC的实现策略:在每一行数据中额外保存两个隐藏字段:当前行创建时的版本号和删除时的版本号(可能为空)。每个事务又有自己的版本号,这样事务内执行CRUD操作时,就通过版本号的比较来达到数据版本控制的目的。具体做法见下面的示意图。
1.5 Mysql的存储引擎
1.5.1 InnoDB存储引擎
InnoDB是Mysql默认的事务型存储引擎,也是最重要,使用最广泛的存储引擎。它被设计用来处理大量的短期事务,短期事务大部分情况下是正常提交的,很少会被回滚。InnoDB性能上的优越和自动崩溃恢复的特性,使得它很流行。
InnoDB的数据存储在表空间中,表空间是由InnoDB管理的一个黑匣子,由一系列的数据文件组成。
InnoDB采用MVCC来支持高并发,并且实现了四个标志的隔离级别。其默认级别为REPETABLE READ(可重复读),并且通过间隙锁(next-key locking)策略防止幻读的出现。间隙锁使得InnoDB不仅仅锁定查询涉及的行,还会对索引中的间隙进行锁定,以防止幻影行的插入。
InnoDB表是基于聚簇索引建立的,聚簇索引对主键查询有很高的性能。不过它的二级索引(非主键索引)中必须包含主键列,所以主键列很大的或,其他索引也会很大。因此索引较多的话,尽量采用较小的主键。
支持热备份
支持可预测性的读,能够自动在内存中创建hash索引以加速读操作的自适应哈希索引。
1.5.2 MyISAM存储引擎
非事务型存储引擎。提供了大量的特性,包括全文索引,压缩,空间函数等。不支持事务和行级锁,而且在崩溃后无法安全恢复。
- 加锁与并发。针对整张表进行加锁,而不是某一行。读取时会对需要读到的所有表加共享锁,写入时则对表加排他锁。
- 支持全文索引,是一种基于分词创建的所有,可以支持复杂的查询
- 压缩表。如果表在创建并导入数据库以后,不会再进行修改操作,那么这样的表或许可以采用MyISAM压缩表。