背景
小编最近接到一个任务,批量获取内部网站用TXT生成的日志,在闲时把日志插入到MySql数据库做分析。为了快速开发小编选择了Entity Framework Core,很快开发完成了。测试数据不是很多,批量插入数据很快完成,效率很高。但是部署到线上问题来了,最开始也挺快,越到后面越慢,慢的无法接受。于是查询了一下官网和某度,只需加一句代码就可以让EF批量插入数据飙升。
代码示例
开始的批量添加代码:
public async void AddRangeAsync(List<T> entities)
{
await _dbContext.AddRangeAsync(entities);
await _dbContext.SaveChangesAsync();
}
在以上方法增加一行,如下:
public async void AddRangeAsync(List<T> entities)
{
//批量添加需要将AutoDetectChangesEnabled给位false
_dbContext.ChangeTracker.AutoDetectChangesEnabled = false;
await _dbContext.AddRangeAsync(entities);
await _dbContext.SaveChangesAsync();
}
原理
微软的解释:“AutoDetectChangesEnabled默认值为 true。这可确保上下文在执行操作(例如 SaveChanges() 或返回更改跟踪信息)之前了解对跟踪实体实例所做的任何更改。如果禁用自动检测更改, DetectChanges() 则必须确保在修改实体实例时调用 。如果不这样做,可能会导致某些更改在返回或返回过时的更改跟踪信息期间 SaveChanges() 无法持久保存”[1]。
这是啥意思呢?ChangeTracker的AutoDetectChangesEnabled属性是Entity Framework中的一个属性,用于控制是否自动检测实体的更改。默认情况下,AutoDetectChangesEnabled属性的值为true,即自动检测更改。每次对实体进行更改(添加、删除、更新)时,Entity Framework会自动检测这些更改,并将其标记为“已更改”。这样,在调用SaveChanges方法时,Entity Framework会自动将这些更改应用到数据库中。
当AutoDetectChangesEnabled属性的值为true时,将对EF的性能造成一定的影响,尤其是批量插入数据。对于插入操作,无论AutoDetectChangesEnabled的值为true还是false,都可以成功插入数据。因为插入操作本身就是一种新增操作,无需进行实体的更改检测。所以在批量插入时,建议把AutoDetectChangesEnabled设置为false。
设置为false具体对操作的数据有没有影响呢?答案是肯定的,分情况。如果插入数据后有上下文操作,那么上下文不会自动更新实体的状态,如果没有后续操作可以忽略。这就需要手动调用DetectChanges方法或将实体状态设置为“已更改”才能使上下文与数据库同步。建议批量插入数据结束时,把AutoDetectChangesEnabled的值改为true。
**结语
**
本文讲述了.NET用EF批量插入数据,改进性能的简单方法。当然还有很多方法,比如可以使用EF批量添加扩展,可以在EF中执行SQL插入语句,还可以用EF执行存储过程的方式批量添加(SQL Server实验过,MySql未实验)等,大家还有啥好方法可以留言。日志分析建议大家用mangodb或者ES等数据库,本案例只是临时数据分析。希望本文对你有所收获,欢迎留言或者吐槽。
参考资料
来源公众号:DotNet开发跳槽