网络层算是计网里很重要的一层,里面有我们听了很多遍但是不知道是啥的 IP 协议,而这个 IP 协议就是网络高层和低层的沟通桥梁。
干什么的
在学一样东西之前,我们先要搞清楚这个东西是用来干嘛的。网络层主要是提供以下服务
- 传输 segment (上一层对数据的叫法)
- 发送方将上一层的数据(segment)封装成 datagram,可以简单理解为在上一层的数据前再添加一个头部。segment 和 datagram 内容上没有区别(多了个Header),是对 packet 在不同层的不同叫法。网络层一般叫数据,Packet 为 datagram
- 对应的接收方往上层传 datagram 的时候就要去掉头部,转成 segement 再给上层
- 检测 datagram 里的头部信息是否匹配
网络层里的分层
在这一层里再会再分为 2 层。
Control Plane
- 网络方面的逻辑交互
- 决定 datagram 在路由器之间的传递,并最终将这个 datagram 发到目的地
Control Plane 又分成两种
- 传统的路由算法,这个算法是在路由里实现的
- Software-defined networking(SDN), 在服务器里实现的
Data Plane
- 主要是用于路由器里的 Forwarding
- 决定 datagram 怎么在路由器里从 Input 传递到对应的 Output
路由器的结构
其实路由器和我们的计算机差不多,但是只有物理层,链路层和网络层。下面是路由器的机器结构,包含 Routing Processor(差不多是电脑的 CPU) 还有一个 High-sppend Switching fabric。后那个是啥后面会说。
现在我们再放大去看那 4 个指向 High-speed Switching fabric 的结构。
上面对应的就是 物理层 -> 链路层 -> 网络层
。可以看到网络层最后就是指向 Switch Fabric,感觉好像很 NB 的样子。现在就来说说这个东西。
Switch Fabric
路由器其实是数据传递的中转站,负责将传入的数据再传到下一个路由器,这个东西主要用用法就是在路由器里面,将传入的数据传出到对应的 Output 接口,
数据输入 -> Input -> 路由器里处理一下 -> 将数据导航到对应的 Output -> Output -> 数据输出
Switch Fabric 就像一个 GPS 一样将数据正确地输出,所以叫 Switching 嘛,这个机制有 3 种实现方法:
- Switching via Memory
- 以前的 Router 就是用这种方式去控制 Switching
- 不好的是这其实就两条线:进入 Memory 和出去 Memory。所以速度就取决于 Memory 的带宽了
- Switching via Bus
- 这个就是中间有一条总线,像是大学宿舍里面的大走廊,数据从某个房间出来,又进入对面的某个房音
- 这种方法速度就受控于大走廊(Bus 总线)的带宽
- Switching via Crossbar
- 这种方法是上面的加强版,一条大走廊不够是吧,那我再多加几条呗
- 因为又加多了总线所以,现在可以实行并行了
层次结构
说完网络层在路由器的位置,我们再来回顾一个整个网络传输是怎么样的。
网络层在整个计算机网络的地位是这样的:
从上面两张图可以看到,IP 协议(网络层中的协议)贯穿了整个计算机网络,没了它我们就连数据都传不了了。
IP 协议
现在我们先看看网络层里最为重要的组成部分——IP协议。下面是IP协议的特性:
- unreliable: 不会恢复丢失的数据,所以不太可靠,丢了就丢了,不管了
- connectionless: 每个包都是独立的,IP不会知道包的收发顺序
- best effort: 不会有质量保证,(不会做吞吐量的保证,没有延迟保证)
由于上面这 3 个特性,IP 太懒了,所以别人就要做更多的事喽。
- 更高层如应用层,传输层协议需要解决丢包问题和重复发送包的问题
- 可能会不接顺序发送包
IP 协议和其他协议
ICMP 协议和 Routing 协议等会会讲。
IP 数据格式
其实数据格式和Http请求格式都差不多,可能字段不一样,不要记住的是一定是 32 Bits 的。
MTU
还记得数据传输的方式么?先从上到下在本机传完,再将数据发到目的地,目的地再从下到上传回应用层。网络层也是要将数据往下传的,往下就是链路层,链路层有一个东西叫 Maximum Transmission Unit。不管网络有多少数据,但是每次传给链路层不能超过这个 MTU。
虽然 IP 的大小可以达到 65535 个 Bytes,但是在链路层会对包的大小有限制,如
- Ethernet: 1500, FDDI: 4352
- 802.3: 1492 , PPP: 296
那么办,网络层有一大堆,你口又那么小。所以工程师想到一个方法——分块传。
IP Fragmentation
不同的链路层实现,就会有不同的 MTU,所以要 fragmentation。分块传递数据遵守下面规则:
- 每个 datagram 会分成小的 datagram 来去匹配 MTU
- 在到终点的时候才会再次组合起来
- IP Header 是用来区分哪个先哪个后
- 发送方或者中间的路由器都可以完成 fragmentation
- 相同的 datagram 可以在传递的过程中被 fragment 几次,但是组合是只会在终点才完成
我们再深入看看 IP Header 都记录了 fragmentation 的什么信息:
- Identification: 相同的 datagram,这里的值就会是一样
- Flags:
- DF: 不能再分了,如果 MTU 实在太小,这个包就丢了算了
- MF: 可以再分
- Fragment offset: 13 Bits, 当前 fragment 在原来 datagram 里的位移, 当前 fragment / 8
- Total length: fragment 的总长度
分块传数据的例子:
Ipv4 Addressing
Ipv4 就是 IP 地址的一种表示,分成两个部分:Network Prefix 和 Host Number。
再举个例子
分配地址例子
Ipv4 分配的应用
假设 125.36.0.0,要给他分配5个子网,同时Host数目大于 250,要怎么做呢?
- 首先 125.36 是不能动的,因为是 prefix,所以只能动后面 8 + 8 位了
- 先看后面 8 位吧,我们要的是大于 250 个主机,所以 2 的 8次方是 256>250,全后8位都将用于主机的分配
- 再看前面的 8 位,要分配的 5 个子网,那 2 的3 次方为8 > 5所以前面只要 3 位就可以了,剩下的5位都可以用于主机的分配
Ipv4 Forwarding
关于 Ipv4 Forwarding 其实说到底就是上面说到的 2 个 Plane:
- Network 里: 数据从一个路由器转到另一个路由器
- Router 里: 数据从路由器的 Input 转到 Output
路由器与 IP
当路由器接收到 IP Packet 的时候会做如下事情:
- IP 头部检验
- 处理头部里的 options
- 解析 IP 地址里的目的地
- 检查 Routing table
- 降低 TTL
- fragmentation
- 计算 checksum
- 传递到下一个节点
- 发送 ICMP 包
路由表
可能到这时候你会问,一个路由器和那么多个路由器连接,单靠 IP 头部信息也不能推测出应该要传给哪个路由器作为下一个中转站呀。哎,这里就需要路由表,每个路由器会维护一张路由表。
里面会记录每个 IP 地址对应要传的下个节点。比如我们的目的地是 10.0.32.0/19(第二个),那么下个中转站就是 R2。
你可能发现这里有 Direct, R2, R3,这些对于有 4 种 Route Types。
- Network Route,最常用的
- Host Route
- Default Route,没有 Network 或者 Host Route 匹配的时候会用这个
- Loopback address,127.0.0.1
Longest Prefix Match
你可以发现好像先匹配最长的前缀的先呀,32 -> 19 -> 19 -> ...-> 8
,还记得前缀表示是子网的前缀么?前缀越长说明在越靠近的子网里。所以这里的匹配是先去找附近的机器,如果找到就不到外面网络里找了。如果最后还找不到要么就回到自己 (127.0.0.0)。
ARP 代理
在链路层的时候我曾说过,每个机器都会有自己的 MAC 地址。当某个机器 A 要发数据给 B ,首先会广播一个 ARP 请求,B 接收后会告诉 A 自己的 MAC,最后才是发送数据。如果有下面的情况:
A -> Router -> B
广播完再等待 B 的 ARP reply 感觉好久呀。所以工程师想到了代理。上面使用 ARP 代理会是这样:
- A 先发 ARP 请求去问 B 的MAC 地址
- Router 先 reply Router 自己的 MAC 地址
- A 以为自己已经知道了B 的地址,所以开始传数据 datagram
- Router 接收到 datagram 后,再发 B 的 ARP 请求,等 B replay 后将 datagram 再传给 B
现在 Router 就好像中转站一样,先将数据从 A 那拿过来,再给问完了 B,再直接给 B。
前提
ARP 代理看起来挺好的,允许两个不同子网的主机共享一个网络前缀。但是要做如下配置才可以:
- 要伪装成是目的地的,这里的 Router 就伪装自己成 B,让 A 以为 Router 就是 B
- 这两个机器是不知道他们其实不同的子网里,要使用 Mask 使得他们以为他们在同一个子网里
ICMP
ICMP (Internet Control Message Protocol)主要内容是:Type, Code, Checksum, IP Header. 通常用于返回的错误信息或是分析路由。一个例子:
如果路由器检测到 datagram 被发到另一个不同的 Router,那么
- 将 IP datagram 发送到正确的 Router
- 发一个 ICMP 信息给主机
主机就会用这个 ICMP 信息来更新自己的 Forwarding Cache.