IN和EXISTS执行顺序不一样。
IN先执行后面的子查询,再执行外部查询,而EXISTS先执行前面的外部查询,再根据外部查询结果依次进行子查询。
EXISTS:存在。
EXISTS(xxxxx)后面的子查询被称做相关子查询,它是不返回列表的值的,只返回一个TRUE或FALSE的结果。
先运行前面的主查询(外部查询),根据主查询的结果依次去相关子查询里查询,如果存在就返回TRUE并输出,反之返回FALSE且不输出,最后使用子查询的结果来确定外部查询的结果集。
例如外部查询返回100行,SQL 就将执行101次查询——一次执行外部查询,然后为外部查询返回的每一行执行一次子查询。
IN:包含。
IN()后面的子查询是返回结果集的,子查询先产生结果集,然后主查询再去结果集里去找符合要求的字段列表,符合要求的输出,反之则不输出。
NOT IN的执行顺序:在表中一条记录一条记录的查询(查询每条记录),符合要求的就返回结果集,不符合的就继续查询下一条记录,直到把表中的记录查询完。也就是说为了证明找不到,所以只能查询全部记录才能证明,并没有用到索引。
NOT EXISTS的执行顺序:根据索引查询,如果存在就返回TRUE,如果不存在就返回FALSE,不会每条记录都去查询。
A表为前面的主查询,B表为后面的子查询。
当B表数据较大时不适合使用IN(),因为它会把B表数据全部遍历一次,IN()适合B表比A表数据小的情况。当B表比A表数据大时适合使用EXISTS(),因为它没有那么遍历操作,只需要再执行一次查询就行。
EXISTS()结果集并不缓存,因为EXISTS()结果集的内容并不重要,重要的是结果集中是否有记录,如果有则返回TRUE,没有则返回FALSE。
如果A表有10000条记录,B表有1000000条记录,那么EXISTS()会执行10000次去判断A表中的id是否与B表中的id相等。可见B表数据越多,越适合EXISTS()发挥效果。
总结:
IN和EXISTS执行顺序不一样,通常情况下EXISTS比IN的效率高,因为EXISTS走索引,而IN不走索引,不过IN()是在内存里遍历比较,而EXISTS()需要查询数据库(查询数据库所消耗的性能更高,内存比较快),因此要看实际情况来选择使用:IN()适合于外表大而内表小的情况;EXISTS()适合于外表小而内表大的情况;当两者数据一样大时,IN与EXISTS效率差不多,可任选一个使用。