OSI七层模型和协议
- 什么是OSI
OSI模型,即开放式通信系统互联参考模型(Open System Interconnection,OSI/RM,Open Systems Interconnection Reference Model),是国际标准化组织(ISO)提出的一个试图使各种计算机在世界范围内互连为网络的标准框架,简称OSI。
OSI将[计算机网络体系结构]划分为以下七层:
由底层向高层依次是:物理层,数据链路层,网络层,传输层,会话层,表示层和应用层。
物理层: 将数据转换为可通过物理介质传送的电子信号 相当于
邮局中的搬运工人
数据链路层: 决定访问网络介质的方式
在此层将数据分帧,并处理流控制。本层 指定拓扑结构并提供硬件寻 址。相当于邮局中的装拆箱工人
网络层: 使用权数据路由经过大型网络 相当于邮局中的排序工人
传输层: 提供终端到终端的可靠连接 相当于公司中跑邮局的送信职员
会话层: 允许用户使用简单易记的名称建立连接 相当于公司中收寄信、写信封与拆信封的秘书
表示层: 协商数据交换格式 相当公司中简报老板、替老板写信的助理
应用层: 用户的应用程序和网络之间的接口老板
- 协议
协议是一个 Big 很高,出现很频繁的词。其实它很好理解,它实际上是一种通信双方共同遵守的规范。比如我需要把性别和年龄传递给另外一台主机,那么我可以定义一个"A 协议",协议规定数据的前 4 个字节表示性别,后四个字节表示年龄。这样对方主机接收时就知道前 4 个字节是性别,而不会错把它当成年龄来处理。
整个互联网世界能够运行,完全得益于各个软件、硬件厂商严格遵守现有的协议。以 IP 协议为例,你可以随便修改它,然后自己弄出一个 IP2 协议,只不过没有人认可、遵守这个协议,所以它毫无用武之地。
物理层
物理层处于 OSI 七层模型的最底端,它的主要任务是将比特流与电子信号进行转换。
在计算机的世界中,一切都由 0 和 1 组成。你看到的这篇文章,在通过网络传输到你电脑的过程中,自然也是以 0 和 1 的形式存在。但是网络传输的介质(比如光纤,双绞线,电波等)中显然是不存在 0 和 1 的。比如在光线中,数据通过光的形式传递。0 和 1 以光的亮灭表示,其中的转换由物理层完成。
如果没有物理层,由 0 和 1 构成的比特流就无法在物理介质中传播。
数据链路层
数据链路层处于 OSI 七层模型的第二层,它定义了通过通信介质相互连接的设备之间,数据传输的规范。
在数据链路层中,数据不再以 0、1 序列的形式存在,它们被分割为一个一个的“帧”,然后再进行传输。
数据链路层中有两个重要的概念:MAC 地址和分组交换。
MAC地址(MAC地址是网卡决定的,是固定的)
MAC 地址是被烧录到网卡 ROM 中的一串数字,长度为 48 比特,它在世界范围内唯一(不考虑虚拟机自定义 MAC 地址)。由于 MAC 地址的唯一性,它可以被用来区分不同的节点,一旦指定了 MAC 地址,就不可能出现不知道往哪个设备传输数据的情况。
分组交换
分组交换是指将较大的数据分割为若干个较小的数据,然后依次发送。使用分组交换的原因是不同的数据链路有各自的最大传输单元(MTU: Maximum Transmission Unit)。不同的数据链路就好比不同的运输渠道,一辆卡车(对应通信介质)的载重量为 5 吨。那么通过卡车运送 20 吨的货物就需要把这些货物分成四部分,每份重 5 吨。如果运输机的载重量是 30 吨,那么这些货物不需要分割,直接一架运输机就可以拉走。
以以太网(一种数据链路)为例,它的MTU是 1500 字节,也就是通过以太网传输的数据,必须分割为若干帧,每个帧的数据长度不超过 1500 字节。如果上层传来的数据超过这个长度,数据链路层需要分割后再发送。
以太网帧
我们用以太网举例,介绍一下以太网帧的格式。
以太网帧的开头是“前导码(Preamble)”,长度为 8 字节,这一段没什么用,重点在于以太网帧的本体。
本体由首部,数据和 FCS 三部分组成:
自学过程
类型部分存储了上层协议的编号,比如上层是 IP 协议,则编号为 0800。
FCS 表示帧校验序列(Frame Check Sequence),用于判断帧是否在传输过程中有损坏(比如电子噪声干扰)。FCS 保存着发送帧除以某个多项式的余数,接收到的帧也做相同计算,如果得到的值与 FCS 相同则表示没有出错。
交换机
交换机是一种在数据链路层工作的网络设备,它有多个端口,可以连接不同的设备。交换机根据每个帧中的目标 MAC 地址决定向哪个端口发送数据,此时它需要参考“转发表”
转发表并非手动设置,而是交换机自动学习得到的。当某个设备向交换机发送帧时,交换机将帧的源 MAC 地址和接口对应起来,作为一条记录添加到转发表中。
下图描述了交换机自学过程的原理
自学过程
关于数据链路层,最重要的一点还是它的定义:“通过通信介质相互连接的设备之间,数据传输的规范”。这说明数据链路层的协议适用于处于同一种数据链路两端的节点。
IP地址专注于网络层,将数据包从一个网络转发到另外一个网络;而MAC地址专注于数据链路层,将一个数据帧从一个节点传送到相同链路的另一个节点。
如果不能理解这一点,就无法理解网络层和 IP 协议。
数据链路层的意义在于,如果没有数据链路层,数据只能以流的形式存在与通信介质中,不知道该发送往哪里,过长的数据流可能无法在通信介质中传输。