经常见到有在循环里面写sql语句,这样有什么问题吗?一般来说如果几十次操作,页面就会等很久才响应。如果几十万次操作数据库,那么时间必然是不可接收的,我也不知道需要多久才能执行完成。
其实如果学习过算法分析,假设操作的数据量是n,那么算法复杂度就是n,即线性复杂度。
如何优化
一般来说合并sql,查询的时候使用缓存。插入的时候大批量提交,如果数据足够大就需要分批提交。
引入的问题
明显循环的书写更加简单,更加的直接。经常写if判断,好不容易写一个循环还是很爽的。引入缓存,引入批量提交,代码量会增加好几倍。难以调试,更容易引入bug,下次阅读的时候相对来说难以了解代码原本的意思。
如果批量数据提交,包含错误处理,去重之类的,就需要一些更好的策略进行处理。
从直觉来说,复杂的代码运行的也不会快。所以这些代码应该交给框架,或者至少脑子清醒的时候去写。
可选的方案
可以考虑优化表设计,简化业务,去掉没有必要的复杂操作。其他的策略包含定时处理存入临时表,引入缓存等等。方法千千万,总有适合你的。还有知道数据库总不是万能的,使用消息队列,很多消息队列性能优秀,而基于发布订阅模式的代码,清晰且容易扩展。
当你遇到类似棘手的问题,你有什么好的解决办法,可以告诉我吗?
当我在说循环里面调用sql时,我在说什么
大多数时候,关心循环sql,是因为太慢了,到了性能调优的时候了。业务量不大的操作,快速开发时,这样写是完全没有问题的。因为关心这些东西的人毕竟是少数,而且影响并不大。
我想说的是,写程序必须有一定的意识,理解代码运行的值,也理解背后的代价。明白io操作巨慢无比,比内存之类的慢了太多太多。循环里面请求http,循环里面读文件也会很慢很慢。
即使是单纯的数组循环有时候也很慢,而hash就很快。算法很重要,我认为更重要的是人,是的人的分析。