在我而言这算是一个复习,然后总结出来给大家当个教材吧。
我也是看视频总结出来的笔记,所以说的都很简单和浅薄。有不全面或者偏颇的地方欢迎指出,共同交流进步哈。(因为我当时是看视频总结的笔记,所以可能说的比较杂乱,我尽量写的分明一点,在最后会附上笔记,忽略我字丑)
索引
索引是什么呢?它相当于字典的目录。
索引:index是帮助mysql高效获取数据的数据结构,索引是数据结构(树,默认是B树),hash等。
索引的弊端:事物都是两面的,有利必然有弊。
- 索引本身很大,可以存放在内存/硬盘中。通常存放在硬盘。
- 索引不是所有情况都适用的。不适合建立索引的字段有:
- 少量数据
- 频繁更新的字段
- 很少使用的字段
- 索引会降低增删改的数据效率
索引的优势:索引有这么多弊端我们还使用的原因是因为优大于劣。
- 提高查询效率(正常一个业务,增删改加一起都不如查询应用的多哟)
- 降低cpu使用率(因为B树本身已经排好序了)
索引的分类:
- 单值索引:单列,一个表可以有多个单值索引
- 唯一索引:不能重复的,一般多是指id
- 复合索引:多个列构成的索引,相当于二级目录
这个符合索引还有一些衍生的概念,比如窄索引,宽索引。一般我们把1-2个列组成的索引叫做窄索引。2个列以上组成的索引叫做宽索引。设计索引的一个重要原则就是能用窄索引不用宽索引。
举个小例子让大家更理解复合索引:如果我把一个表中name,age这两个列做成复合索引(注意顺序很重要)。那么我们形成的目录一级目录是name,二级目录是age。在name相同时才会age再形成目录。因为它本身的排序不是像目录一样一行一行列出来的,所以我们尽量用目录来想像它比较好理解。下面是图解:
这也就涉及到一个索引失效的问题。我们在创建的时候,字段A,B,C这样创建。那么A是一级目录,B是二级目录,C是三级目录。我们可以直接只查找A,也可以查找AB,ABC。但是如果直接查找B或者BC索引就会失效。想想你拿一个单词的第二个字母去英语字典里查找。。还用说什么了么?
索引的创建:
创建索引方法很多啊,尤其是现在各种可视化的出现。不过这里还是简单的写一下吧,毕竟当年也辛辛苦苦记了笔记。
方式一:create 索引类型 索引名 on 表(字段)
- 单值索引:create index age_index on demo(age);
- 唯一索引:create unique index id_index on demo(id);
- 复合索引:create index name_age_index on demo(name,age);
方式二:alter table 表 add 索引类型 索引名(字段) - 单值索引:alter table demo add index age_index(age)
- 唯一索引:alter table demo add unique index id_index(id)
- 复合索引:alter table demo add index age_name_index(age,name)
有几点注意的事项:
- alter是ddl,所以不需要commit
- 一个字段是primary key,默认是主键索引。
- 唯一索引可以是null,主键索引不可以。
- 删除索引:drop index 索引名 on 表。
- 查询索引:show index from 表。
这里说一下,上面说的方法都是原生的sql,比如我现在习惯使用navicat,所以可以直接操作。。爽的不行。
然后删除查询也都是直接可视的,方便的不得了。就不多说了。
引擎
mysql做例子,还有个引擎是可以优化的。mysql中引擎分两种:
- InnoDB:事物优先(适合高并发,是行锁)
- MyISAM:性能优先(表锁)
sql需要优化的点:
- 性能低
- 执行时间长
- 等待时间长
- sql语句欠佳(尤其是连接查询)
- 索引失效或者索引无用
- 服务器参数设置不合适
这里要额外说一下sql语句的编写过程和解析过程:
编写过程:select ——>dinstinct——>from——>join ——>on——>where——>group by——>having——>order by
解析过程:form——>on——>join——>where——>group by——>having——>select——>distinct——>order by
然后我们常说的sql优化,主要是优化字段类型,长度,索引等。
分析sql执行计划:
其实我们一个sql语句的执行过程是一套流程,因为我不太会用简书画图,所以还是用笔画图传上来吧
由此可见,我们写的sql语句不是直接执行的,还要优化器自动优化一下。用explain关键字可以模拟优化器的执行语句。一会儿我们再说这个explain关键字查出来的东西。
sql优化的规则:
- 多表查询时,先查数据量小的表。
- 子查询时,先查询内层在查询外层。
- sql语句优化级别从好到坏的等级:
system>const>eq_ref>ref>range>index>all.
sql优化等级:
- system是个理想型。就跟语文试卷的一百分似的。不聊这个了。
- 当用主键查询/唯一查询时,是const级别的。这个就是我们能做到的最优的了。
- eq_ref:唯一性索引,对于索引键查询(有且只有一行数据返回),常见于主键索引和唯一索引(一对一表的外键)。
- ref:非唯一性索引,单值索引。就相当于一级目录。
- range:查询指定范围的行,where后面是个范围。这里要注意一点,in会让索引失效!!sql优化等级会变成all。
- index:只查询索引并且没有条件。比如上面age是索引了。然后 select age from demo;这个语句的优化等级就是index。
- all:这个没啥说的,就是没索引,全表扫描。
8.在explain中Extra的值是Usingfilesort,UsingTemporary:这是一种特殊情况,不仅没优化还有额外的消耗就是这个(这个我没遇到过,但是能想象的到,比如查询A但是用B分组或者查询A用B排序)。
上面说的这些等级在explain中可以看到。
单表优化常用方法:
- 加索引
- 调整sql语句顺序
- 调整索引
多表优化常用方法:
- 小表驱动大表。
- 小表在左,大表在右。
程序设计的原则:双循环中,外层用小表,内层用大表。
有一点要注意的,使用like的时候,尽量以常量开头,如%开头则索引会失效。sql是否优化了可以通过explain查看。
BTree
因为上面也提到了b树,所以还是单独聊聊吧。其实我也不是很理解。只能说一个浅显的认识而已。这里也就是简单的说一下。
首先,B树不仅可以二叉,还可以三叉,多叉。而只要大于二叉的都叫做BTree。
据说三层BTree可以存放上百万数据。
BTree一般都指B+树,数据全部存放在叶节点中。(这里简单的一个三叉树图)
好了,就写到这里吧,希望日后算法的知识会的更多以后能把B树这个坑填完~~~然后有不同意见或者自己理解的可以留言或者私聊。
全文手打,如果你觉得对你有帮助麻烦点个赞点个关注啥的~~