关于Rails中N+1查询的简单理解

  • 什么是N+1问题
    举个例子,我们数据库中有两张表,一个是Users,一个是BlogsBlogs中含有一个外键user_id,指向了Users的主键id
    想要得到所有User以及其分别对应的Blog,一种写法是
SELECT * FROM Users; 
SELECT * FROM Users WHERE Blogs.user_id = #{user.id}

这样我们实际对数据库做了N+1次查询:选择所有User一次得到N个User,对于N个User分别选择其对应的Blog一共N次。所以,一共执行了N+1次查询,这就是N+1问题。

  • Rails中的N+1问题
    两个model:user、blog,其中
has_many :blogs
belongs_to :user

想要获得所有user的所有blogs时,使用:

users = User.all
users.each {|user| puts user.blogs}

输出是

User Load (0.6ms)  SELECT `users`.* FROM `users`

  Blog Load (0.3ms)  SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 2  ORDER BY `blogs`.`created_at` DESC
#<Blog:0x00000005b0cfe8>
#<Blog:0x00000005b0ce58>
#<Blog:0x00000005b0cd18>
#<Blog:0x00000005b0cbb0>
#<Blog:0x00000005b0ca70>
#<Blog:0x00000005b0c930>
#<Blog:0x00000005b0c7f0>
#<Blog:0x00000005b0c6b0>
#<Blog:0x00000005b0c570>
#<Blog:0x00000005b0c430>
#<Blog:0x00000005b0c2f0>
 Blog Load (0.2ms)  SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 5  ORDER BY `blogs`.`created_at` DESC
#<Blog:0x00000005ae2c98>
#<Blog:0x00000005ae2b58>
#<Blog:0x00000005ae2a18>
#<Blog:0x00000005ae28b0>
#<Blog:0x00000005ae26f8>
#<Blog:0x00000005ae25b8>
#<Blog:0x00000005ae2450>
#<Blog:0x00000005ae2310>
#<Blog:0x00000005ae2108>
#<Blog:0x00000005ae1f00>
 Blog Load (0.4ms)  SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 20  ORDER BY `blogs`.`created_at` DESC
 Blog Load (0.2ms)  SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 21  ORDER BY `blogs`.`created_at` DESC

上面就造成了N+1的查询问题。每遇到一个user,就会去执行一次SELECTblogs.* FROMblogsWHEREblogs.user_id= 5 ORDER BYblogs.created_atDESC的查询语句。如果user很多,就容易造成性能问题。

  • 如何解决
    rails推荐的解决方法是用Eager Loading Associations
    在查询user的时候,使用includes同时把blogs也查询出来。
users = User.all.includes(:blogs)
user.each {|user| puts user.blogs}

输出:

User Load (0.3ms)  SELECT `users`.* FROM `users`
 Blog Load (0.3ms)  SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` IN (2, 5, 20, 21)  ORDER BY `blogs`.`created_at` DESC

#<Blog:0x00000003a7c6c0>
#<Blog:0x00000003a7c468>
#<Blog:0x00000003a7a960>
#<Blog:0x00000003a7a2d0>
#<Blog:0x00000003a7a0c8>
#<Blog:0x00000003a79ee8>
#<Blog:0x00000003a799e8>
#<Blog:0x00000003a78f20>
#<Blog:0x00000003a784f8>
#<Blog:0x00000003a77f30>
#<Blog:0x00000003a77cb0>
#<Blog:0x00000003a7ce40>
#<Blog:0x00000003a7cbe8>
#<Blog:0x00000003a7c990>
#<Blog:0x00000003a7c170>
#<Blog:0x00000003a7bec8>
#<Blog:0x00000003a7b860>
#<Blog:0x00000003a7b608>
#<Blog:0x00000003a7b180>
#<Blog:0x00000003a7af78>
#<Blog:0x00000003a7adc0>

我的理解是这样:在第一次查询users的时候,通过一条查询语句把相关的blogs也查询出来了IN (2,5,20,21)。这样,在后面使用users的时候。就不用再去查询数据库了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容