MySQL的索引

MySQL的索引在存储引擎层实现,而不是服务层

分类

1、B-Tree索引

  1. InnoDB使用B+树作为底层实现,是MySQL默认存储引擎的默认索引类型
  2. 索引对多个值排序的依据是定义表时,索引的定义顺序。
  3. 查询类型:全键值查询、键值范围索引、键前缀查询
    4.限制:如果不是从最左列索引开始,则不能使用索引,不能跳过索引中的列。

2、 哈希索引

  1. 基于哈希表实现,只有精确匹配所有索引列的查询才有效。只有Memory引擎显式支持哈希索引
  2. 精确查找速度很快(O(1)),除非冲突很多。使用链地址法解决冲突。
    3.限制:哈希表不按索引值,而是按哈希值排列的。所以它是无序的,也就不支持排序操作。
    不支持部分索引,因为使用所有索隐列来计算哈希值。只支持等值比较。
  • 自适应哈希:对于频繁使用的索引,在BTree上再建一个哈希索引。本身仍使用BTree查找,但它使用哈希值进行查找,在where子句中手动指定哈希函数。不建议使用MD5、SHA1作为哈希函数,因为它的返回值是字符串,并且比较长。可以考虑CRC32.
    3、空间数据索引:MyISAM引擎支持空间数据索引,使用RTree作为底层实现
    4、全文索引:查找文本关键字,而不是直接比较索引的值。使用MATCH AGAINST而不是一般的where。

高性能索引策略

1、独立的列:索引不是表达式的一部分,也不能是函数的参数
如,select * from tb where id = id+1,一眼看出要找id等于4的行,但程序会先遍历id+1中的id,找到真正的目标id,再去检索目标id所在的行。
2、前缀索引和索引选择性:这种策略针对长的大型数据或文本。选择足够长的前缀保证选择性,同时不能太长。
selectivity = count(distinct index_column)/count(*)
selectivity ∈[0,1],值越大,说明选择性越强
3、多列索引:注意顺序,将选择性最高的放在前面。
4、聚簇索引: 它是一种数据存储方式,将BTree索引和数据行紧凑地存储在一起。由于一张表不能把数据行放在两个地方,因此一张表只能有1个聚簇索引。
1.优点:

  • 把相关数据存储在一起,避免多余的磁盘IO
  • 数据访问更快
  • 使用覆盖索引(要找的数据就在索引列中)的查询可以直接使用页节点中的主键值
    2.缺点
    • 索引更新代价高
    • 二级索引(非聚簇索引)可能更大
    • 二级索引需要访问两次,因为二级索引保存的是行的主键值,先去二级索引找主键,再用主键区聚簇索引找数据行。
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容