MySQL 作为绝大多数互联网公司首选的关系型数据库,掌握它是开发工程师必备的技能。该篇文章从索引的角度聊聊 MySQL 慢 sql 优化
一般的应用系统,读写比例在10:1左右,而且插入操作和一般的更新操作很少出现性能问题,遇到最多的,也是最容易出问题的,还是一些复杂的查询操作,所以查询语句的优化显然是重中之重。
sql语句字段要与mysql表中的字段对应,一次sql语句尽量锁最少的行。
尽量选择区分度高的列作为索引。区分度的公式是count(distinct col)/count(*),表示字段不重复的比例,比例越大我们扫描的记录数越少。因为使用索引的目的是能尽快锁定一个小范围,如果通过索引锁定的还是很大的范围,那使用索引效率就不会高。
使用索引,索引字段要尽量小。
sql语句查询的速度取决于查询时进行磁盘I/O的次数,而磁盘I/O次数取决于b+树的高度。B+树结构如下图所示:数据量一定的情况下,b+树的高度由磁盘块大小和数据项大小来决定,磁盘中存储的数据项即是索引字段。磁盘块的大小是固定的,索引字段越小,磁盘块中存储的数据项越多,指针越多,b+树的高度越小。
联合索引满足最左匹配原则。当b+树的数据项是复合的数据结构,比如(name,age,sex)的时候,b+数是按照从左到右的顺序来建立搜索树的,name是第一个比较因子,必须要先根据name来搜索才能知道下一步去哪里查询。mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配。对于=和in可以乱序。
索引列不能参与计算,保持列“干净。因为b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,成本太大。
where 字段名 like % 不会走索引。举例:
select count(1) from perbid_q_house where userCode like concat('%' , #{lastUserCode}) ,在不改变程序语义的情况下,如果想走索引,在数据库表中新建一行userCode的反转字符串ext_1,,通过如下语句即可走索引。
<select id="countByLastUserCode" resultType="java.lang.Integer">
select count(1) from perbid_q_house where ext_1 like concat(reverse(#{lastUserCode}),'%')
</select>
- 类似如下sql语句,当用group by 进行分组查询时,count(1)会比较耗时。如果建立索引还达不到要求的话,可以观察表中数据的 id 特点,把count(1)做一个转化,提高查询速度。
<select id="cityStatics" resultMap="AllColumnMap">
select city_code,city_name,min(id) offset_begin,max(id) offset_end
,count(1) record_count
from perbid_q_house
group by city_code,city_name
</select>
表中数据的id是自增2,所以可以采用如下方法将count(1)做一个转换,提高查询速度。
<select id="cityStatics" resultMap="AllColumnMap">
select city_code,city_name,min(id) offset_begin,max(id) offset_end
,cast((max(id)-min(id)+2)/2 as signed) record_count
from perbid_q_house
group by city_code,city_name
</select>
- 尽量的扩展索引,不要新建索引。