本文讨论传输层的多路复用与多路分解,也就是将网络层所提供的主机到主机交付服务扩展到为在主机上运行的应用程序所提供的进程到进程交付服务。
在目的主机,传输层从紧邻其下的网络层接收报文段。传输层负责将这些报文段中的数据交付给在主机上运行的合适的应用进程。
一个例子:假定你正坐在计算机前下载Web页面,同时还在运行一个FTP会话。此时你就有2个网络应用进程在运行,即一个FTP进程和一个HTTP进程。当计算机的传输层从底层的网络层接收数据时,它需要将所接收到的数据定向到这2个进程中的一个。
接收主机中的传输层通过一个套接字来传递数据。由于在任何一个时刻接收主机上可能有多个套接字,所以每个套接字都必须有唯一的标识符。
在每个传输层报文段中包含了两个端口号字段,在接收端,传输层检查这些字段并标识出接收套接字,然后将报文段定向到该套接字。
可以将一个套接字理解成两小段内存空间:发送缓存和接收缓存,这两段存储空间通过套接字的变量名来标识。
将传输层报文段中的数据放置到正确的套接字的工作称为多路分解,确切地说,多路分解其实是多路分发,或者说是数据流的分解。数据交付到特定套接字的工作也就是将数据放到正确的存储位置的过程。从源主机的不同套接字中收集数据块,井为每个数据块封装上首部信息(在多路分解时使用)从而生成报文段,然后将报文段传递到网络层的工作称为多路复用。
传输层多路复用的要求:1套接字有唯一标识符,2每个报文段有特殊字段来指示该报文段所要交付的套接字。这些特殊字段最重要的是源端口号字段(source port number field)和目的端口号字段(destination port number field)。
端口号是一个16比特的数字,其大小在0-65535之间。0-1000范围的端口号称为周知端口号,它们是保留给诸如HTTP和FTP之类的公有的应用层协议的。
当一个网络应用程序运行时,必须为其分配一个端口号。
[if !supportLists]1.[endif]无连接的多路复用与多路分解 假定主机A中的一个进程具有的UDP端口号为9157,它要发送一个应用程序数据块给主机B中的另一进程,该进程具有的UDP端口号为6428。主机A中的传输层创建一个传输层报文段,其中包括应用程序数据、源端口号9157、目的端口号6428和两个其他字段。然后,传输层将生成的报文段传递到网络层。 网络层将该报文段封装到一个IP数据报中,并尽力而为地将报文段交付给接收主机。如果该报文段到达接收主机B,接收主机传输层就检查该报文段中的目的端口号6428,并将该报文段传递给端口号6428所标识的套接字。注意到主机B能够运行多个进程,每个进程有自己的UDP套接字及对应的端口号。当从网络接收到达的UDP报文段时,主机B通过检查该报文段中的目的端口号,将报文段定向(多路分解)到相应的套接字。
因此,一个UDP套接字是由一个包含目的lP地址和目的端口号的二元组来标识的。因此,如果两个UDP报文段有不同的源IP地址或源端口号,但具有相同的目的IP地址和目的端口号,那么这两个报文段将通过相同的目的套接字定向到相同的目的进程。
在A到B的报文段中,源端口号作为“返回地址”的一部分,即当B需要发回一个报文段给A时,B到A的报文段中的目的端口号便从A到B的报文段的源端口号中取值。
2.面向连接的多路复用与多路分解
TCP套接字是由一个四元组(源IP地址,源端口号,目的IP地址,目的端口号)来标识的。
这样,当一个TCP报文段从网络到达一台主机时,主机使用这4个值来将报文段定向(多路分解)到相应的套接字。
在TCP服务器程序接受客户机连接,accept()函数创建并返回一个新的连接套接字用于与客户机的通信,并将这个套接字与请求报文段中的4个值:1该报文段中的源端口号,2源主机IP地址,3该报文段中的目的端口号,4自身的IP地址建立关联。也就是说新创建的连接套接字通过这4个值来标识。
所有后续到达的报文段,如果它们的源端口号、源主机IP地址、目的端口号和目的IP地址都与这4个值匹配,则被多路分解到这个套接字。
为什么使用4元组呢?
例如主机B向服务器C发起了两个HTTP会话(两个浏览器窗口),主机A向服务器C发起了一个HTTP会话。主机A与主机B及服务器C都有自己的唯一IP地址,主机B为其两个连接分配了两个不同的源端口号(5775和9157)。因为主机A独立选择源端口号,因此它也可能将源端口号9157分配给其HTTP连接。
对于服务器C来说,它得区分不同的浏览器连接请求,对于每个请求,它都有相应的套接字(套接字具有不同的发送/接收缓存)与之对应。它要分发不同主机浏览器过来的请求,并返回不同的响应消息给客户机。
目的端口号:C服务器运行了不同的应用,显然,只有web服务器使用了80端口,应此C服务器在转发报文段给应用的时候要看这个字段。
目的IP地址:一般服务器都有两个网卡,也就是说它会有两个IP地址,所以服务器C得区分一个请求从哪个网卡进来,以便返回响应消息。事实上只有一块网卡的时候也是可以绑定多个IP地址的,这是大家需要注意的。
源端口号:服务器C返还消息时使用,例如服务器C返还给B的响应消息,即使来自同一个主机,也需要放入不同浏览器页面的套接字。因此C必须区分来自同一主机不同浏览器窗口的请求。
源IP地址:A和C的浏览器页面即使使用了相同的端口号,但这两个连接有不同的源IP地址,C也需要进行正确地区分。
3 Web服务器与TCP 运行Web服务器的主机,通常在端口80监听请求。当客户机(如浏览器)向服务器发送报文段时,所有报文段的目的端口都为80。如前所述,服务器能够根据源IP地址和源端口号来区分来自不同客户机的报文段。但是套接字与进程之间并非总是有着一一对应的关系。事实上,Web服务器通常一个服务进程可以为每个新的客户机连接创建一个具有新连接套接字的线程。显然,对于这样的服务器,在任意给定的时间内都可能有很多套接字(具有不同的标识)连接到同一个进程。