1.系统假死
描述:系统假死指的是能ping通该服务器,但是不能ssh远程连接
原因:可能由于有一个进程大量的fork子进程,造成了内存被占满,这时会触发oomkill,系统就会随机kill掉一个进程,然后父进程会立马fork一个新的子进程接替工作,然后系统又会kill,这样成了一个死循环,都被沾满,没有ssh进程的空间了
解决办法:提前将ssh优先级提高,这时,ssh就可优先使用cpu资源,就可链接上服务器将占用内存高的进程kill掉
2.系统的sudo不能正常使用
描述:普通用户使用chmod(可能chmod有suid权限)将 sudo命令进行修改,将其suid权限修改成为别的权限,再次使用sudo提权时,提示,sudo命令必须归root所有,并且要设置suid,这之后使用sudo 不能进行正常的提权
解决办法:所以可以进单用户模式,将sudo权限改回来,设置一个suid,或者进入单用户模式将root密码改一下,然后通过root修改sudo命令的权限。
3.定时任务被删除
描述:在定时任务里,员工不小心crontab -c 将所有的定时任务给删除了,这里有许多的定时任务都是不同的人在这里设置的,有的可能删除之后对公司业务造成亏损
解决办法:可以通过cron日志(/var/log/cron)来分析日志尝试解决,可以从时间间隔,操作命令等方面来尝试恢复,无疑非常的浪费时间。
4.本地数据库迁云
描述:将本地数据库上传至云数据库时,会造成iowait时间变长,以至于平均负载变高,原来是云上所谓的高效云盘读写速度非常慢
解决办法:需要换一个sas口的硬盘,io等待时间会立即降下来