ARP 地址解析协议
数据链路如以太网和令牌环网都有自己的寻址机智,这是使用数据链路的任何网络都必须遵从的。
当一台主机把以太网数据帧发送到位于同一局域网上的另一台主机时,是根据48bit以太网地址来确定目的接口的。
ARP(地址解析协议)为IP地址到对应的硬件地址之间提供动态映射。我们子所以用动态的这个词是因为这个过程是自动完成的。
RARP(逆地址解析协议)是被那些没有磁盘驱动器的系统使用(一般是无盘工作站或X终端),它需要系统管理员进行手工设置。
示例
敲下下面的这个形式的命令:
%ftp bsdi
都会进行以下的步骤:
1)应用程序FTP客户端调用函数gethostbyname(3)把主机名(bsdi)转换成32bit的IP地址。这个函数在DNS(域名系统)中称作解析器,这个转换过程或者使用DNS,或者在较小网络中使用一个静态的主机文件(etc/hosts)。
2)FTP客户端请求TCP用得到的额IP地址建立连接。
3)TCP发送一个连接请求分段到远程的主机,即用上述IP地址发送一份IP数据报。
4)如果目的主机在本地网络上,那么IP数据报可以直接送到目的主机上。如果目的主机在一个远程网络上,那么就通过IP选路函数来确定位于本地网络上的下一站路由器地址,并让它转发IP数据报。在这两种情况下,IP数据报都是被送到位于本地网络上的一台主机或路由器。
5)假定是一个以太网,那么发送端主机必须把32bit的IP地址转化成48bit的以太网地址。从逻辑Internet地址到对应的物理硬件地址需要进行翻译,这就是ARP的功能。ARP本来是用于广播网络的,有许多主机或路由器连在同一个网络上。
6)ARP发送一份ARP请求的以太网数据帧给以太网上的每个主机。这个过程称作广播。ARP请求数据帧中包含目的主机的IP地址,其意思是"如果你是这个IP地址的拥有者,请回答你的硬件地址"。
7)目的主机的ARP收到这份广播后,识别出这是发送端在询问它的IP地址,于是发送一个ARP应答,这个ARP应答包含了IP地址以及硬件地址。
8)收到ARP应答后,使ARP进行请求---应答交换的IP数据报现在可以传送了。
9)发送IP数据报到目的主机。
在ARP背后有一个基本概念,那就是网络接口有一个硬件地址(一个48bit的值,标示不同的以太网或令牌环网络接口)。在硬件层次上进行的数据帧交换必须有正确的接口地址,不是TCP/IP的32bit的IP地址。知道主机的IP地址并不能够将数据报发送给主机。驱动程序必须知道目的端的硬件地址才能发送数据。ARP的功能是在32bit的IP地址和采用不同网络技术的硬件地址之间提供动态映射。
点对点不适用ARP,当设置这些链路时(一般在引导过程进行),必须告知内核链路每一段的IP地址。像以太网地址这样的硬件地址并不涉及。
ARP高速缓存
ARP高效运行的原因是由于每个主机上都有一个ARP高速缓存。这个高速缓存存放了最近Internet地址到硬件地址之间的映射记录。
我们可以使用arp命令来检查ARP告诉缓存。
ARP的分组格式
以太网报头中的前两个字段是以太网的源地址和目的地址。目的地址全为1的特殊地址是官博地址。电缆上的所有以太网接口都要接收广播的数据帧。
两个字节长度以太网帧类型表示后面的数据的类型,对于ARP请求和应答来说,该字段的值为0x0806。
硬件类型字段表示硬件地址的类型。它的值为1表示以太网地址。协议类型字段表示要映射的协议地址类型。它的值为0x0800即表示IP地址。它的值与包含IP数据报的以太网数据帧中的类型字段的值相同。
接下来的两个1字节的字段,硬件地址长度和协议地址长度分别之处硬件地址和协议地址的长度,以字节为单位。对于以太网上IP地址的ARP请求或应答来说,它们的值分别为6和4。
操作字段指出四种操作类型,它们是ARP请求(值为1)、ARP应答(值为2)、RARP请求(值为3)和RARP应答(值为4)。这个字段必需的,因为ARP请求和ARP应答的帧类型字段值时相同的。
接下来的四个字段是发送端的硬件地址(在本例中是以太网地址)、发送端的协议地址(I P地址)、目的端的硬件地址和目的端的协议地址。注意,这里有一些重复信息:在以太网的数据帧报头中和A R P请求数据帧中都有发送端的硬件地址。
对于一个A R P请求来说,除目的端硬件地址外的所有其他的字段都有填充值。当系统收到一份目的端为本机的 A R P请求报文后,它就把硬件地址填进去,然后用两个目的端地址分别替换两个发送端地址,并把操作字段置为 2,最后把它发送回去。
ARP举例
一般的例子
telnet到无效的服务器连接
在第1行中,源端主机(bsdi)的硬件地址是0:0:c0:6f:2d:40。目的端主机的硬件地址是ff:ff:ff:ff:ff:ff,这是一个以太网广播地址。电缆上的每个以太网接口都要接收这个数据帧并对它进行处理。
第1行中紧接着的一个输出字段是arp,表明帧类型字段的值0x0806,说明此数据帧是一个ARP请求或回答。在每行中,单词arp或ip后面的值60指的是以太网数据帧的长度。由于ARP请求或回答的数据帧长都是4 2字节(28字节的ARP数据,14字节的以太网帧头),因此,每一帧都必须加入填充字符以达到以太网的最小长度要求:60字节。
第1行中的下一个输出字段 arp who-has表示作为ARP请求的这个数据帧中,目的IP地址是svr4的地址,发送端的IP地址是bsdi的地址。tcpdump打印出主机名对应的默认IP地址
从第2行中可以看到,尽管ARP请求是广播的,但是ARP应答的目的地址却是bsdi(0:0:c0:6f:2d:40)。ARP应答是直接送到请求端主机的,而不是广播的。
tcpdump打印出arp reply 的字样,同时打印出响应者的主机名和硬件地址。
第3行是第一个请求建立连接的TCP段。它的目的硬件地址是目的主机 (svr4)。
最后需要指出的一点,在tcpdump命令输出中,我们没有看到svr4在发出第一段TCP报文(第4行)之前发出的ARP请求。这是因为可能在svr4的ARP高速缓存中已经有bsdi的表项。
一般情况下,当系统收到ARP请求或发送ARP应答时,都要把请求端的硬件地址和IP地址存入ARP高速缓存。在逻辑上可以假设,如果请求端要发送IP数据报,那么数据报的接收端将很可能会发送一个应答。
特殊的例子
我们指定一个并不存在的Internet地址---根据网络号和子网号所对应的的网络确实存在,但是并不存在指定的主机号。
令人感兴趣的是看到多次进行ARP请求:第1次请求发生后5.5秒进行第2次请求,在24秒之后又进行第3次请求(在第21章我们将看到TCP的超时和重发算法的细节)。tcpdump命令输出的超时限制为29.5秒。但是,在telnet命令使用前后分别用date命令检查时间,可以发现Telnet客户端的连接请求似乎在大约75秒后才放弃。事实上,我们在后面将看到,大多数的BSD实现把完成TCP连接请求的时间限制设置为75秒。
ARP高速缓存超时设置
在ARP高速缓存中的表项一般都要设置超时值。从伯克利系统演变而来的系统一般对完整的表项设置超时值为20分钟,而对不完整的表项设置超时值为3分钟(在前面的例子中我们已见过一个不完整的表项,即在以太网上对一个不存在的主机发出ARP请求)。当这些表项再次使用时,这些实现一般都把超时值重新设为20分钟。
ARP代理
如果ARP请求是从一个网络的主机发送到另一个网络的主机,那么连接着两个网络的路由器就可以回答该请求,这个过程称作委托ARP或ARP代理。
示例:
当主机gemini有一份IP数据报要传给地址为140.252.1.29的sun时,gemini比较网络号和子网号,因为它们都是相同的,所以发送IP地址为140.252.1.29的ARP请求。路由器netb识别出该IP地址属于它的一个拨号主机,于是把它的以太网接口地址140.252.1.183作为硬件地址回答。gemini通过以太网发送IP数据报到netb路由器,netb再通过拨号链路SLIP把数据报发送到sun。
ARP代理也称作混合ARP(promiscuousARP)或ARP出租(ARP hack)。这些名字来自于ARP代理的其他用途:通过两个物理网络之间的路由器可以互相隐藏物理网络。在这种情况下,两个物理网络可以使用相同的网络号,只要把中间的路由器设置成一个ARP代理,以响应一个网络到另一个网络主机的ARP请求。
免费ARP
我们可以看到的另一个ARP特性称作免费ARP。它是指主机发送ARP查找自己的IP地址。通常,它发生在系统引导期间进行接口配置的时候。
免费ARP的作用:
1)一个主机可以通过它来确定另一个主机是否设置了相同的IP地址。
2)如果发送免费ARP的主机正海改变了硬件地址,那么这个分组就可以使其他主机高速缓存中旧的硬件地址进行相应的更新。一个比较著名的ARP协议事实[Plummer 1982]是,如果主机收到某个IP地址的ARP请求,而且它已经在接收者的高速缓存中,那么就要用ARP请求中的发送端硬件地址(如以太网地址)对高速缓存中相应的内容进行更新。主机接收到任何ARP请求都要完成这个操作(ARP请求是在网上广播的,因此每次发送ARP请求时网络上的所有主机都要这样做)。