- 什么是N+1问题
举个例子,我们数据库中有两张表,一个是Users
,一个是Blogs
。Blogs
中含有一个外键user_id
,指向了Users
的主键id
。
想要得到所有User
以及其分别对应的Blog
,一种写法是
SELECT * FROM Users;
SELECT * FROM Users WHERE Blogs.user_id = #{user.id}
这样我们实际对数据库做了N+1次查询:选择所有User一次得到N个User,对于N个User分别选择其对应的Blog一共N次。所以,一共执行了N+1次查询,这就是N+1问题。
- Rails中的N+1问题
两个model
:user、blog,其中
has_many :blogs
belongs_to :user
想要获得所有user的所有blogs时,使用:
users = User.all
users.each {|user| puts user.blogs}
输出是
User Load (0.6ms) SELECT `users`.* FROM `users`
Blog Load (0.3ms) SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 2 ORDER BY `blogs`.`created_at` DESC
#<Blog:0x00000005b0cfe8>
#<Blog:0x00000005b0ce58>
#<Blog:0x00000005b0cd18>
#<Blog:0x00000005b0cbb0>
#<Blog:0x00000005b0ca70>
#<Blog:0x00000005b0c930>
#<Blog:0x00000005b0c7f0>
#<Blog:0x00000005b0c6b0>
#<Blog:0x00000005b0c570>
#<Blog:0x00000005b0c430>
#<Blog:0x00000005b0c2f0>
Blog Load (0.2ms) SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 5 ORDER BY `blogs`.`created_at` DESC
#<Blog:0x00000005ae2c98>
#<Blog:0x00000005ae2b58>
#<Blog:0x00000005ae2a18>
#<Blog:0x00000005ae28b0>
#<Blog:0x00000005ae26f8>
#<Blog:0x00000005ae25b8>
#<Blog:0x00000005ae2450>
#<Blog:0x00000005ae2310>
#<Blog:0x00000005ae2108>
#<Blog:0x00000005ae1f00>
Blog Load (0.4ms) SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 20 ORDER BY `blogs`.`created_at` DESC
Blog Load (0.2ms) SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` = 21 ORDER BY `blogs`.`created_at` DESC
上面就造成了N+1的查询问题。每遇到一个user,就会去执行一次SELECT
blogs.* FROM
blogsWHERE
blogs.
user_id= 5 ORDER BY
blogs.
created_atDESC
的查询语句。如果user很多,就容易造成性能问题。
- 如何解决
rails推荐的解决方法是用Eager Loading Associations
:
在查询user的时候,使用includes
同时把blogs
也查询出来。
users = User.all.includes(:blogs)
user.each {|user| puts user.blogs}
输出:
User Load (0.3ms) SELECT `users`.* FROM `users`
Blog Load (0.3ms) SELECT `blogs`.* FROM `blogs` WHERE `blogs`.`user_id` IN (2, 5, 20, 21) ORDER BY `blogs`.`created_at` DESC
#<Blog:0x00000003a7c6c0>
#<Blog:0x00000003a7c468>
#<Blog:0x00000003a7a960>
#<Blog:0x00000003a7a2d0>
#<Blog:0x00000003a7a0c8>
#<Blog:0x00000003a79ee8>
#<Blog:0x00000003a799e8>
#<Blog:0x00000003a78f20>
#<Blog:0x00000003a784f8>
#<Blog:0x00000003a77f30>
#<Blog:0x00000003a77cb0>
#<Blog:0x00000003a7ce40>
#<Blog:0x00000003a7cbe8>
#<Blog:0x00000003a7c990>
#<Blog:0x00000003a7c170>
#<Blog:0x00000003a7bec8>
#<Blog:0x00000003a7b860>
#<Blog:0x00000003a7b608>
#<Blog:0x00000003a7b180>
#<Blog:0x00000003a7af78>
#<Blog:0x00000003a7adc0>
我的理解是这样:在第一次查询users的时候,通过一条查询语句把相关的blogs也查询出来了IN (2,5,20,21)
。这样,在后面使用users的时候。就不用再去查询数据库了。