MySQL(三)——连接

连接的原理

嵌套连接

  • 两表连接,驱动表(比如左连接的左表)

    • 步骤1:选取驱动表,使用与驱动表相关的过滤条件,选取代价最低的单表访问方法来执行对驱动表的单表查询。
    • 步骤2:对上一步骤中查询驱动表得到的结果集中每一条记录,都分别到被驱动表中查找匹配的记录。
  • 可以对被驱动表加索引

  • 有时候连接查询的查询列表和过滤条件中可能只涉及被驱动表的部分列,而这些列都是某个索引的一部分,这种情况下即使不能使用eq_refrefref_or_null或者range这些访问方法执行对被驱动表的查询的话,也可以使用索引扫描,也就是index的访问方法来查询被驱动表。所以我们建议在真实工作中最好不要使用*作为查询列表,最好把真实用到的列作为查询列表。

基于块的嵌套循环连接

  • 嵌套连接中被驱动表可能需要访问很多次,如果不能用索引或者数据量大,则IO压力很大,要尽量减少被驱动表的访问次数
  • 每次访问被驱动表会加载到内存,然后去和驱动表中的一条记录做匹配,然后又从内存中删掉,循环很多次。所以提出了join buffer的概念,就是执行连接查询前申请一块固定大小的内存,先把若干条驱动表结果集中的记录装在这个join buffer中,然后开始扫描被驱动表,每一条被驱动表的记录一次性和join buffer中的多条驱动表记录做匹配,且都是在内存中完成的,减少了很多IO操作。且只有查询列表和过滤条件中的列会放到join buffer中,所以尽可能不要用*,这样join buffer可以存放更多的记录。

查询优化

  • 移除不必要的括号

  • 常量传递: a=5 and b>a -> a=5 and b>5

  • 等值传递

  • 移除没用的条件

  • HAVING和WHERE合并:如果没有sum、max等聚集函数以及group by,那么会把having和where合并。

  • 优先执行常量表,即主键或唯一二级索引的等值匹配

  • 外连接消除:内连接的驱动与被驱动表可以互相转换,而外连接不行。指定的WHERE子句中包含被驱动表中的列不为NULL值的条件称之为空值拒绝(英文名:reject-NULL)。在被驱动表的WHERE子句符合空值拒绝的条件后,外连接和内连接可以相互转换。这种转换带来的好处就是查询优化器可以通过评估表的不同连接顺序的成本,选出成本最低的那种连接顺序来执行查询。

  • 子查询

    • 对于包含不相关的标量子查询或者行子查询的查询语句来说,MySQL会分别独立的执行外层查询和子查询,就当作两个单表查询就好了。如:会先查询子查询, 然后用子查询的值当做常数值进行外层查询

      SELECT * FROM s1 WHERE key1 = (SELECT common_field FROM s2 WHERE key3 = 'a' LIMIT 1);
      
      
    • 对于相关的标量子查询,对外层查询的表进行扫描,每次获取一条记录,取出子查询中涉及到的列的值进行子查询,依次循环。如:

      SELECT * FROM s1 WHERE key1 = (SELECT common_field FROM s2 WHERE s1.key3 = s2.key3 LIMIT 1);
      
      
  • IN子查询

    物化表:如果子查询的结果集非常的大,那父查询的每条记录都要判断查询条件,会很耗性能,所以mysql会把子查询的结果集写入一个临时表(采用Memory存储引擎)里,列就是子查询的列,且结果会去重,并对列建立哈希索引,这样判断某个操作值在不在子查询结果集里就会很快。或者如果子查询结果集太大了,则会变成基于磁盘保存,索引变为B+树。这个过程叫做物化表。转换之后其实就可以变成内连接了

    SELECT * FROM s1 
        WHERE key1 IN (SELECT common_field FROM s2 WHERE key3 = 'a');
    等价于
    SELECT s1.* FROM s1 INNER JOIN materialized_table ON key1 = m_val;
    
  • semi-join:如果想要不通过临时表,直接转换成连接查询,则会产生问题,如果子查询的结果集中有多条数据没有经过去重直接内连接会有多条记录,于是提出了semi-join半连接,对s1的某条记录,我们只关心在s2表中是否存在与之匹配的记录,不关心有多少条,最终的结果集中只保留s1表的记录。

    • 转成半连接的条件:
      • 该子查询必须是和IN语句组成的布尔表达式,并且在外层查询的WHERE或者ON子句中出现。
      • 外层查询也可以有其他的搜索条件,只不过和IN子查询的搜索条件必须使用AND连接起来。
      • 该子查询必须是一个单一的查询,不能是由若干查询由UNION连接起来的形式。
      • 该子查询不能包含GROUP BY或者HAVING语句或者聚集函数。
    • 对于不能转为半连接的查询有两种优化方法:
      • 1、先物化再查询
      • 2、IN转EXISTS
  • 执行带有派生表的语句时,会延迟物化。或者把派生表和外层的表合并来消除派生表。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,692评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,482评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,995评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,223评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,245评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,208评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,091评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,929评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,346评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,570评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,739评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,437评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,037评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,677评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,833评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,760评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,647评论 2 354