一、应用优化
在实际生产环境中,由于数据库本身的性能局限,就必须要对前台的应用进行一些优化,来降低数据库的访问压力。
1.1、使用连接池
对于访问数据库来说,建立连接的代价是比较昂贵的,因为我们频繁的创建关闭连接,是比较耗费资源的,我们必须要使用数据库连接池,以提高访问的性能。
1.2、减少对MySQL的访问
避免对数据进行重复检索
在编写应用代码时,需要能够理清对数据库的访问逻辑。能够一次连接就获取到结果的,就不用两次连接,这样可以大大减少对数据库无用的重复请求。
比如 ,需要获取书籍的id 和name字段 , 则查询如下:
select id , name from tb_book;
之后,在业务逻辑中有需要获取到书籍状态信息, 则查询如下:
select id , status from tb_book;
这样,就需要向数据库提交两次请求,数据库就要做两次查询操作。其实完全可以用一条SQL语句得到想要的结果。
select id, name , status from tb_book;
增加cache层
在应用中,我们可以在应用中增加 缓存 层来达到减轻数据库负担的目的。缓存层有很多种,也有很多实现方式,只要能达到降低数据库的负担又能满足应用需求就可以。
因此可以部分数据从数据库中抽取出来放到应用端以文本方式存储, 或者使用框架(Mybatis, Hibernate)提供的一级缓存/二级缓存,或者使用redis数据库来缓存数据,还可以使用基于Guava Cache的JVM级别的内存缓存。
1.3、负载均衡
负载均衡是应用中使用非常普遍的一种优化方法,它的机制就是利用某种均衡算法,将固定的负载量分布到不同的服务器上, 以此来降低单台服务器的负载,达到优化的效果。
利用MySQL复制分流查询
通过MySQL的主从复制,实现读写分离,使增删改操作走主节点,查询操作走从节点,从而可以降低单台服务器的读写压力。
采用分布式数据库架构
分布式数据库架构适合大数据量、负载高的情况,它有良好的拓展性和高可用性。通过在多台服务器之间分布数据,可以实现在多台服务器之间的负载均衡,提高访问效率。
可以采用MySQL的MMM或MHA架构,业界成熟和应用比较广的MHA架构
MySQL集群高可用架构:https://www.jianshu.com/p/14d1c07820ce
二、Mysql中查询缓存优化
写在前面:查询缓存从MySQL 5.7.20开始已被弃用,并在MySQL 8.0中被删除。
考虑到当前的局限性,在MySQL 5.7的生存期内将继续支持查询缓存。MySQL 8.0将不支持查询缓存,并且鼓励用户升级以使用服务器端查询重写或ProxySQL作为中间人缓存。
2.1、概述
Query cache 作用于整个 MySQL,主要用来缓存 MySQL 中的查询结果集,也就是一条SQL语句执行的结果集,所以仅仅只能针对select语句。当我们打开了 Query Cache 功能,MySQL在接受到一条select语句的请求后,如果命中缓存,也就是说所需结果集已经在缓存中了,后面一系列步骤都不用再执行,直接从缓存拿到结果集返回给客户端,可以极大的提高查询性能!
开启Mysql的查询缓存,当执行完全相同的SQL语句的时候,服务器就会直接从缓存中读取结果,当数据被修改,之前的缓存会失效,修改比较频繁的表不适合做查询缓存。
2.2、执行步骤
sql 查询数据库 执行步骤如下:
- 1、客户端发送一条查询给服务器。
- 2、服务器先会检查查询缓存,如果命中了缓存,则立即返回存储在缓存中的结果。否则进入下一阶段。
- 3、服务器端进行SQL解析、预处理,再由优化器生成对应的执行计划。
- 4、MySQL根据优化器生成的执行计划,调用存储引擎的API来执行查询。
- 5、将结果返回给客户端。
2.3、查询缓存配置
- 1、查看当前的MySQL数据库是否支持查询缓存:
SHOW VARIABLES LIKE 'have_query_cache';
- 2、查看当前MySQL是否开启了查询缓存 :
SHOW VARIABLES LIKE 'query_cache_type';
- 3、查看查询缓存的占用大小 :
SHOW VARIABLES LIKE 'query_cache_size';
- 4、查看查询缓存的状态变量:
SHOW STATUS LIKE 'Qcache%';
各个变量的含义如下:
参数 | 含义 |
---|---|
Qcache_free_blocks | 查询缓存中的可用内存块数 |
Qcache_free_memory | 查询缓存的可用内存量 |
Qcache_hits | 查询缓存命中数 |
Qcache_inserts | 添加到查询缓存的查询数 |
Qcache_lowmen_prunes | 由于内存不足而从查询缓存中删除的查询数 |
Qcache_not_cached | 非缓存查询的数量(由于 query_cache_type 设置而无法缓存或未缓存) |
Qcache_queries_in_cache | 查询缓存中注册的查询数 |
Qcache_total_blocks | 查询缓存中的块总数 |
2.4、开启查询缓存
MySQL的查询缓存默认是关闭的,需要手动配置参数 query_cache_type , 来开启查询缓存。
query_cache_type 该参数的可取值有三个 :
值 | 含义 |
---|---|
OFF 或 0 | 查询缓存功能关闭 |
ON 或 1 | 查询缓存功能打开,SELECT的结果符合缓存条件即会缓存, 否则,不予缓存,显式指定SQL_NO_CACHE,不予缓存 |
DEMAND 或 2 | 查询缓存功能按需进行,显式指定 SQL_CACHE 的SELECT 语句才会缓存;其它均不予缓存 |
在 /etc/my.cnf 配置中,增加以下配置 :
#开启Mysql的查询缓存,决定是否缓存查询结果。这个变量有三个取值:0,1,2,分别代表了off、on、demand。
query_cache_type = 1
配置完毕之后,重启服务既可生效 ;
然后就可以在命令行执行SQL语句进行验证 ,执行一条比较耗时的SQL语句,然后再多执行几次,查看后面几次的执行时间;获取通过查看查询缓存的缓存命中数,来判定是否走查询缓存。
2.5、查询缓存SELECT选项
可以在SELECT语句中指定两个与查询缓存相关的选项 :
- SQL_CACHE:如果查询结果是可缓存的,并且 query_cache_type 系统变量的值为ON或 DEMAND ,则缓存查询结果 。
- SQL_NO_CACHE:服务器不使用查询缓存。它既不检查查询缓存,也不检查结果是否已缓存,也不缓存查询结果。
例子:
SELECT SQL_CACHE id, name FROM customer;
SELECT SQL_NO_CACHE id, name FROM customer;
2.6、查询缓存失效的情况
- 1、SQL 语句不一致的情况, 要想命中查询缓存,查询的SQL语句必须一致。
SQL1 : select count(*) from tb_item;
SQL2 : Select count(*) from tb_item;
- 2、当查询语句中有一些不确定的时,则不会缓存。如 : now()、current_date()、curdate()、curtime()、rand()、uuid()、user()、database() 。
SQL1 : select * from tb_item where updatetime < now() limit 1;
SQL2 : select user();
SQL3 : select database();
- 3、不使用任何表查询语句。
select 'A';
- 4、查询 mysql, information_schema或 performance_schema 数据库中的表时,不会走查询缓存。
select * from information_schema.engines;
5、在存储的函数,触发器或事件的主体内执行的查询。
6、如果表更改,则使用该表的所有高速缓存查询都将变为无效并从高速缓存中删除。这包括使用 MERGE 映射到已更改表的表的查询。一个表可以被许多类型的语句,如被改变 INSERT、UPDATE、DELETE、TRUNCATE TABLE、ALTER TABLE、DROP TABLE 或 DROP DATABASE 。
三、MySQL内存管理及优化
3.1、内存优化原则
- 1、将尽量多的内存分配给MySQL做缓存,但要给操作系统和其他程序预留足够内存。
- 2、MyISAM 存储引擎的数据文件读取依赖于操作系统自身的IO缓存,因此,如果有MyISAM表,就要预留更多的内存给操作系统做IO缓存。
- 3、排序区、连接区等缓存是分配给每个数据库会话(session)专用的,其默认值的设置要根据最大连接数合理分配,如果设置太大,不但浪费资源,而且在并发连接较高时会导致物理内存耗尽。
3.2、MyISAM 内存优化
myisam存储引擎使用 key_buffer 缓存索引块,加速myisam索引的读写速度。对于myisam表的数据块,mysql没有特别的缓存机制,完全依赖于操作系统的IO缓存。
key_buffer_size
key_buffer_size决定MyISAM索引块缓存区的大小,直接影响到MyISAM表的存取效率。可以在MySQL参数文件中设置key_buffer_size的值,对于一般MyISAM数据库,建议至少将1/4可用内存分配给key_buffer_size。
在/etc/my.cnf 中做如下配置:
key_buffer_size=512M
read_buffer_size
如果需要经常顺序扫描myisam表,可以通过增大read_buffer_size的值来改善性能。但需要注意的是read_buffer_size是每个session独占的,如果默认值设置太大,就会造成内存浪费。
read_rnd_buffer_size
对于需要做排序的myisam表的查询,如带有order by子句的sql,适当增加 read_rnd_buffer_size 的值,可以改善此类的sql性能。但需要注意的是read_rnd_buffer_size 是每个session独占的,如果默认值设置太大,就会造成内存浪费。
3.3、InnoDB 内存优化
innodb用一块内存区做IO缓存池,该缓存池不仅用来缓存innodb的索引块,而且也用来缓存innodb的数据块。
在内部,innodb 缓存池逻辑上由 free list、flush list 和 lru list 组成:
- free list:空闲缓存块列表
- flush list:是需要刷新到此磁盘的缓存块列表
- lru list:是 innodb 正在使用的缓存块,它是 innodb buffer pool 的核心。
innodb 使用的 lru 算法与 myisam 的“中点插入策略”lru算法很类似,大致原理是:将 lru list 分为 young sublist 和 old sublist,数据从磁盘读入时,会将该缓存块插入到 lru list 的“中点”,即 old sublist 的头部;经过一定时间的访问(由 innodb_old_blocks_time 系统参数决定),该数据块将会由 old sublist 转移到 young sublist 的头部,也就是整个lru list 的头部;随着时间推移,young sublist 和 old sublist 中较少被访问的缓存块将从各自链表的头部逐渐向尾部移动;需要淘汰数据块时,优先从链表尾部淘汰。这种设计同样是为了防止偶尔被访问的索引块将访问频繁的热块淘汰。
innodb_buffer_pool_size
该变量决定了 innodb 存储引擎表数据和索引数据的最大缓存区大小。在保证操作系统及其他程序有足够内存可用的情况下,innodb_buffer_pool_size 的值越大,缓存命中率越高,访问InnoDB表需要的磁盘I/O 就越少,性能也就越高。
在一个专用的数据库服务器上可以将 80% 的物理内存分配给 InnoDB buffer pool ,需要注意避免设置过大而导致页的交换。
#查看 buffer pool 的使用情况
show global status like '%Innodb_buffer_pool%';
#计算 InnoDB 缓存池的命中率,如果命中率太低,则应该考虑扩充内存、增加 innodb_buffer_pool_size 的值
(1-Innodb_buffer_pool_reads/Innodb_buffer_pool_read_requests)*100
参考设置:
1)物理内存小于 1 GB
innodb_buffer_pool_size=128M
innodb_log_file_size=48M
2)物理内存为 1 GB ~ 4GB
innodb_buffer_pool_size=物理内存*0.5
innodb_log_file_size=128M
3)物理内存大于 4 GB
innodb_buffer_pool_size=物理内存*0.75
innodb_log_file_size=1024M
innodb_log_buffer_size
决定了innodb重做日志缓存的大小,对于可能产生大量更新记录的大事务,增加innodb_log_buffer_size的大小,可以避免innodb在事务提交前就执行不必要的日志写入磁盘操作。
innodb_log_buffer_size=10M
innodb_old_blocks_pct
innodb_old_blocks_pct (old sublist 的比例),可以根据 InnoDB Monitor的输出信息来调整 innodb_old_blocks_pct 的值。如果 youngs/s 的值很低,可能需要适当增大innodb_old_blocks_pct 的值或减少 innodb_old_blocks_time 的值。
show engine innodb status\G;
*************************** 1. row ***************************
Type: InnoDB
Name:
Status:
=====================================
......
Pages made young 0, not young 0
0.00 youngs/s, 0.00 non-youngs/s
......
当然,调整 old_sublist 的比例由系统参数 innodb_old_blocks_pct 决定,其取值范围是 5 ~ 95, 默认值是 37。
通过以下命令可以查看其当前设置:
show global variables like '%innodb_old_blocks_pct%';
innodb_old_blocks_time
一个缓存数据块被插入到 midpoint(old sublist)后,至少要在 old sublist 停留超过 innodb_old_blocks_time(ms)后,才有可能被转移到 young sublist。
可以根据 InnoDB Monitor的输出信息来调整 innodb_old_blocks_time 的值。在进行表扫描时,如果 non-youngs/s 很低,youngs/s 很高,就应该考虑将 innodb_old_blocks_time 适当调大,以防止表扫描将真正的热数据淘汰。
show engine innodb status\G;
*************************** 1. row ***************************
Type: InnoDB
Name:
Status:
=====================================
......
Pages made young 0, not young 0
0.00 youngs/s, 0.00 non-youngs/s
......
innodb_buffer_pool_instances
适当增加此参数的值,可以降低并发导致的内部缓存访问冲突,改善性能。 InnoDB 缓存系统会将 innodb_buffer_pool_size 的大小平分为 innodb_buffer_pool_instances 个 buffer pool。
innodb_max_dirty_pages_pct
- 1、控制缓冲池中脏页的最大比例,如果脏页达到或超过该值, InnoDB 后台线程将开始缓存刷新。
- 2、若 Innodb_buffer_pool_wait_free 的值增长较快,则说明 InnoDB 经常在等待空闲缓存页,如果无法增大缓存池,那么应将 innodb_max_dirty_pages_pct的值调小或将 innodb_io_capacity 的值提高,以加快脏页的刷新。
innodb_io_capacity
* 1、代表磁盘系统的 I/O 能力,对于转速较低的磁盘;如 7200RPM 的磁盘,可将 innodb_io_capacity 的值降低到 100;而对于固态硬盘和由多个磁盘组成的盘阵,innodb_io_capacity 的值可以适当增大。对于固态硬盘来说,建议设置为 2000 或者更高。
2、innodb_io_capacity 决定一批刷新脏页的数量,当缓存池脏页的比例达到 innodb_max_dirty_pages_pct 时, InnoDB 大约将 innodb_io_capacity 个已改变的缓存页刷新到磁盘。
3、当脏页小于 innodb_max_dirty_pages_pct 时,如果 innodb_adaptive_flushing=ON,InnoDB 将根据函数 buf_flush_get_desired_flush_rate 返回的重做日志产生的速度来确定要刷新的脏页数。
4、在合并插入缓存时,InnoDB 每次合并的页数是 0.05*innodb_io_capacity
5、若 Innodb_buffer_pool_wait_free 的值增长较快,则说明 InnoDB 经常在等待空闲缓存页,如果无法增大缓存池,那么应将 innodb_max_dirty_pages_pct的值调小或将 innodb_io_capacity 的值提高,以加快脏页的刷新。
innodb_doublewrite
对于要求超高性能,有能容忍极端情况下少量数据丢失的应用,可以通过在配置文件中增加 innodb_doublewrite=0 参数设置来关闭 innodb_doublewrite,以尽量满足性能方面的要求。
join_buffer_size & sort_buffer_size
如果 Sort_merge_passes 的值很大,可以考虑调整参数 sort_buffer_size 的值来增大排序缓存区,以改善带有 order by 子句或 group 子句 SQL 的性能。
show global status like 'Sort_merge_passes';
注意:join_buffer_size 和 sort_buffer_size 都是面向用户服务线程分配的,如果设置过大造成内存浪费,甚至导致内存交换。尤其是 join_buffer_size,如果是多表关联的复杂查询,还可能会分配多个 join buffer,因此最好是设置较小的全局 join_buffer_size,而对需要做复杂连接操作的 session 单独设置较大的 join_buffer_size。
四、MySQL并发参数调整
从实现上来说,MySQL Server 是多线程结构,包括后台线程和客户服务线程。多线程可以有效利用服务器资源,提高数据库的并发性能。在Mysql中,控制并发连接和线程的主要参数包括 max_connections、back_log、thread_cache_size、table_open_cahce。
4.1、max_connections
采用max_connections 控制允许连接到MySQL数据库的最大数量,默认值是 151。如果状态变量 connection_errors_max_connections 不为零,并且一直增长,则说明不断有连接请求因数据库连接数已达到允许最大值而失败,这是可以考虑增大max_connections 的值。
Mysql 最大可支持的连接数,取决于很多因素,包括给定操作系统平台的线程库的质量、内存大小、每个连接的负荷、CPU的处理速度,期望的响应时间等。在Linux 平台下,性能好的服务器,支持 500-1000 个连接不是难事,需要根据服务器性能进行评估设定。
注意:每一个 session 操作 MySQL 数据库表都需要占用文件描述符,数据库连接本身也要占用文件描述符,因此在增大 max_connections 值时,也要注意评估 open_files_limit 的设置是否够用。
4.2、back_log
back_log 参数控制MySQL监听TCP端口时设置的积压请求栈大小。如果MySql的连接数达到max_connections时,新来的请求将会被存在堆栈中,以等待某一连接释放资源,该堆栈的数量即back_log,如果等待连接的数量超过back_log,将不被授予连接资源,将会报错。5.6.6 版本之前默认值为50,之后的版本默认为50 +(max_connections / 5), 但最大不超过900。
如果需要数据库在较短的时间内处理大量连接请求, 可以考虑适当增大back_log 的值。
4.3、table_open_cache
- 1、该参数用来控制所有SQL语句执行线程可打开表缓存的数量。
- 2、每一个 SQL 执行线程至少都要打开 1 个表缓存,这个参数可以根据 max_connections(最大连接数) * N(每个连接关联查询中所涉及表的最大个数) 来设定。
- 3、在未执行 flush tables 命令的情况下,如果 MySQL 状态变量 Opened_tables 的值较大,说明 table_open_cache 设置的过小,应适当增大。
- 4、注意:增大 table_open_cache 的值,会增加 MySQL 对文件描述符的使用量,因此,需要注意评估 open_files_limit 的设置是否够用。
4.4 thread_cache_size
为了加快连接数据库的速度,MySQL 会缓存一定数量的客户服务线程以备重用,通过参数 thread_cache_size 可控制 MySQL 缓存客户服务线程的数量。
通过计算线程 cache 的失效率 Threads_created/Connections 来调整 thread_cache_size 值。该值越接近1,说明线程 cache 命中率越低,应该考虑 适当增加 thread_cache_size 的值。
innodb_lock_wait_timeout
- 1、该参数是用来设置InnoDB 事务等待行锁的时间,默认值是50ms , 可以根据需要进行动态设置。
- 2、对于需要快速反馈的业务系统来说,可以将行锁的等待时间调小,以避免事务长时间挂起。
- 3、对于后台运行的批量处理程序来说,可以将行锁的等待时间调大, 以避免发生大的回滚操作。
参考:
MySQL集群高可用架构
https://blog.51cto.com/11286233/2043902
https://www.cnblogs.com/Mr-Echo/p/12155461.html