sql server 数据库hang死处理一个案例

一、问题描述

此种现象实则少见，一旦遇见，如没有处理经验足以令一个身经百战sql server DBA怀疑人生，从业18年sql server数据库以来，第二次遇见，和第一次遇到一样瞬间被打入懵逼状态

遇到的问题，进程大量阻塞，大量的僵尸进程，影响就是整个数据库处于hang死状态，客户端请求大量超时，干脆就请求不进来，数据库服务器cpu并不高，在30%左右。

1）kill进程，解决不了，正所谓kill我一个，会有千千万万个我马上冲进来

2）重启数据库服务器，解决不了，重启完了，进程马上阻塞

3）优化sql，解决不了，大量被阻塞的都是主键key-value的update单条语句，insert单条语句，甚至是阻塞源

4）只能程序端一个模块一个模块的服务器停止，直到某个模块停止服务，阻塞解开

第一次遇见此问题是2年前，也就是2018年3,4月份，当时数据库处于hang死状态，hang死一段时间后，always on 的1主8从的某些从库会跟主库断开同步。针对此种问题束手无策，DBA经理决定跟微软开了case，case部署一套监控，监控出来的数据都是16进制，看着像编译语言，文件反馈给微软分析。微软一个女工程师反馈，反馈的是针对一个自动增长表内存资源争用问题，需要程序调整解决。数据库在程序解决前要做的是做了一个监控循环脚本，当监控进程的一个参数到某一个临界值，就kill进程（只可惜后来赌气离职走人，笔记本也被我撒气摔坏了，此监控脚本在我这里已石沉大海），kill进程有点粗鲁，甚至有点残暴，但总比整个数据库hang死要好很多。那段好几天电话跟那个微软女工程师沟通交流，声音比较甜美，起码四个+号，本来就对微软工程师有崇敬之感，又一女工程，崇敬感加倍！不过，转面一想，能挑起微软工程师职位，想必是李莫愁，灭绝师太级的人物吧，嘿嘿

二、问题源头

此种问题不是通常慢查询，加加索引，优化一下sq就能搞定的。因为慢查询是慢，但他自己在玩，并不影响别人。这个问题的现象不是，一些简单的key-value的单条主键update或者单条insert语句被阻塞，甚至成为阻塞源。此刻，一个叫做“闩锁”的名词该闪亮登场了。

闩锁是SQL Server存储引擎使用轻量级同步对象，用来保护多线程访问内存内结构。

对于行级别锁引入闩锁的概念是非常重要的，不然的话在内存中会出现丢失更新（Lost Updates）的现象。如我所说的，闩锁是存储引擎使用的轻量级同步对象，是SQL Server用来保护内存结构的。闩锁只不过是类似于多线程编程里的所谓的临界区（Critcal Section）概念。

在传统并发编程里，临界区是同时只能一个线程运行的代码。闩锁本身是个临界区的特殊版本，因为它允许多个并发读操作。

闩锁是用来协调数据库里多个线程物理执行，然而锁是基于选择的事务隔离级别，用来逻辑获得需要的隔离级别。作为开发者或DBA的你，你可以用不同方式影响锁——例如通过SQL Server里的隔离级别，或者通过各种可用锁提示。

然而闩锁是不能以直接方式控制的。在SQL Server里没有闩锁提示，也没有可用闩锁隔离级别。下表是锁和闩锁之间的比较：

锁（Locks）闩锁（Latches）

三、闩锁处理

面对闩锁，DBA束手无策，处理需要开发重改架构代码，大家都知道一个大数据量的系统，有太多事务就已经很dei儿，要是事务里面还有很多线程，或者引起闩锁的自动增长内存资源抢占问题，更是dei儿上加dei儿！

数据库hang死，如果进程里wait_type会有大量的PAGELATCH出现，这时候就考虑一下闩锁问题，先一个模块一个模块的试，定位到相应引起闩锁的模块，此模块如有有自动增长或者多线程，如果还有事务就大事务化小事务，小事务化无，多线程不适合用oltp里面，尽量减少或者干脆就消除，多线程可以用在olap里面。对于自动增长的这种，目前我还没想到该如何处理，设计上尽量让操作同一自增长表不同sql尽量不在小事务上相互交叉，别相互在内存争资源。

四、结束语

对技术无论何时何地都该怀有敬畏之心。不能装逼，虽说装逼装的好容易当领导，但在技术领域上永远在路上。

最后编辑于：2020.12.05 11:02:27

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,651评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,468评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,931评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,218评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,234评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,198评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,084评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,926评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,341评论 1赞 311
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,563评论 2赞 333
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,731评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,430评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,036评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,676评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,829评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,743评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,629评论 2赞 354

sql server 数据库hang死处理一个案例

推荐阅读更多精彩内容