客户端开十个线程对http服务器进行压力测试,结果只获取了几次结果就一直超时,recv函数返回10060建立链接失败。于是我在怀疑是iocp的问题,仔细检查代码并没发现可疑之处,打断点,却收到了客户端的数据,但是没发送数据,怀疑iocp链接是否有问题。
找到以前的iocp github例子,开十个客户端并发测试,并没有什么问题。因为我对该例子做了大量优化,于是测试我最基础的iocp服务,也没发现问题。然后把http服务业务剥离,测试,也没有问题。
怀疑是否是业务太过复杂,但是不会造成以后的链接都超时的情况。分析业务发现数据库的操作造成了问题。于是测试数据库连接池,但数据库连接池以前就测试过并发问题。但还是分析了连接池源代码。有没有锁问题,发现并无问题。还去看了其他人的连接池实现,发现还没我的实现的完美。
又转到http服务这边来,发现条件变量一直wait,在wait处和释放出加上断点。发现一直没有释放。查看代码,原来有一个条件下直接返回了,并没释放数据库链接。
总结:
1 类库的开发要慎之又慎,必须得有一些功能性测试。不然造成排错问题。同时也要对类库有一些信心。
2 排错时还是应该由浅入深,先从最外层进行判断。