导语
记一次实验室服务器故障排查,网络方面的知识只有大二上过的计算机网络,纯小白了。
事情背景
实验室里的服务器长期闲置,最近要跑Spark,于是可以用上这个闲置的服务器。我想从我的笔记本ssh远程连接过去跑就好。但是ssh连不上,于是我问实验室的学长他们之前是怎么用的。他们给我的答复是没试过远程连接,都是坐过去那里直接跑的,然后我过去体验了一下,坐在那也太热了吧。。。服务器噪音也很大。。。所以我就开始检查为什么不能远程连接。
排查过程
- 无法ssh?-> 是否已经安装ssh? -> 已安装
- ssh是否允许远程连接? -> 允许
- 防火墙是否开启对应端口? -> 已开启
那就估计不是ssh的问题,只能从头开始排查....首先是看看网络拓扑,校园网进来到路由器再分到交换机,然后入网到集群服务器。
- 服务器是否联网?-> Ping 外部网络 -> 通 -> 联网
- 外网可否Ping服务器? -> 无法Ping -> 不通
- 服务器是否可以Ping到网关? (事后想这一步有点多余,如果可以Ping外网,那肯定服务器到网关是通的) -> traceroute google.com(第一行即网关IP)-> 通
- 服务器是否允许外网Ping? ->net.ipv4.icmp_echo_ignore_all=1 ->允许
这时候就比较明了,应该是网关这里卡住了。但是不确定是不是入网的时候学校对端口有什么安全策略,好像只能发邮件问问学校IT部门了。发完邮件等回复的时候,我想说不定是路由器的问题吧。看看路由器配置。
- 连一下192.168.1.1? -> 无法连接
- 啥玩意啊,路由器底下写着主页是192.168.1.1啊
- 试一下把IP最后的主机号改成1,就是直接url输网关看看
- emmm还真的就进来了路由器配置页面
- 账号密码不知道 -> 查了一下初始默认的 -> 密码错误
- 没法了,问一下学长,他们说之前借给另一个教授组集群,他们可能改过密码,然后还说想起来好像说是数据有敏感的地方。
好的,那就很明了了,我猜肯定是路由器设置了白名单吧。但去哪里找这个路由器的账号密码啊,学长也不知道那个教授的联系方式,只能等老板去问了。然后我想着今天是弄不好了,但是又手贱(之前后面的部分我都是从路由器拉网线接到我的笔记本上弄)。
- 试一下直接从服务器上路由器配置的页面看看 -> 说不定密码被保存了呢
- 好的 还真的被保存了。。。。
进去看了,确实是因为里面设置的不允许来自WAN的访问。由于不知道这个教授的数据还在不在里面,所以我不敢贸然设置成允许,毕竟他这么严格的控制外网,估计有点东西吧,虽然说是很久以前用的估计有数据也早迁走了。。。但是我还是谨慎一点。
- 设置白名单?-> 所有笔记本都是用学校覆盖的Wi-Fi DHCP动态分配IP的
- 不允许外网访问 -> 进入内网的方法? -> 网线 or Wi-Fi
- 坐在旁边从路由器拉网线接电脑?-> 热
- 关闭Wi-Fi隐藏 -> 笔记本连路由器的Wi-Fi进内网
好的感觉开了路由器的Wi-Fi功能好像就很好解决了。但是如果Wi-Fi暴露出来了,那所有人还是有入口可以进到内网了,只要连上Wi-Fi就进来了,还是有点风险啊,不过Wi-Fi的密码还是有一点点点作用的,我想...