代理(proxy)是位于客户端和服务器之间的一种中介。它分析客户端向服务器的请求,如果请求的数据在代理缓存中已经存在,则会代替服务器进行响应。如果没有则代理网络用户去取得网络信息。它工作在OSI模型的对话层。
代理服务器工作原理
代理服务器构建在内部网络和Internet之间,
客户端首先向代理服务器发出请求数据包
代理服务器收到该请求后,根据代理服务器中预设的访问规则表,用于检验当前收到的请求是否满足规则约束,如果满足则代理会预计开始替客户端计算机获取信息。
代理服务器会首先到自己的硬盘里面,即cache中查看有没有客户端计算机需要的数据,如果有,则将数据直接发送到客户端计算机。否则代理向互联网请求数据。
数据取回后,代理服务器就会将取得的数据存储一份到缓存中。最后才将数据传回客户端计算机使用。
代理服务器用途
如前所述,在不使用代理服务器的情况下,用户使用网络浏览器直接去连接其他Internet站点取得网络信息时,需要发出请求等待回答。有了代理服务器后,浏览器向代理发出请求,当代理服务器接收到请求后,由代理服务器取回浏览器所需要的信息并传送给客户端浏览器。其主要功能如下
共享网络,如通过 Squid 系统自带的共享等代理服务器访问外部站点的信息。这些代理服务器也都能提供企业级的文件缓共享网络存、复制和地址过滤等服务。充分利用局域网出口的有限带宽,加快内网用户的访问速度,能解决仅仅有一条线路一个公有 lP ,在这种公有 IP 资源严重不足的情况下,满足局域网众多用户同时共享上网的需求。
访问代理,由于网络环境拥堵或网络故障灯原因,用户通常会通过代理服务器绕道访问目的站点。另外,代理服务器通常会备份有相当数量的缓存文件,如果当前所访问的数锯在代理服务器的缓存文件中,则可直接读取,而无需再连接到远端 Web 服务器。这样可以达到加快访问网站速度,节约通信带宽的目的。
防止攻击,通过代理服务器完成内部主机的访问使内部主机地址等信息不会发送到外部,隐藏了自己的真实地址信息,还可隐藏自己的 IP 。更有效地保护了内部主机。
充当防火墙,囚为所有使川代理服务器的用户都必须通过代理服务器访问远程站点,因此在代理服务器卜就可以设置相应的限制,以过滤或屏蔽掉某终信息。
提高下载速度,突破了一 个 IP 、一个下载线程的限制以及电信和联通的用户 互上对方的电影网站下载的限制。
方便用户管理,通过代理服务器,管理员可以设置用户验证和记账功能,对用户进行登记,并对用户的访问时间、访问地点、信息流最进行统计。没有登记的用户无权通过代理服务器访问 Internet。
隐藏身份,代理服务器使内部用户访问Internet时受到保护,内部网的用户要对外发布信息就需要使用代理服务器的反向代理功能。这样就不会彭响到内部网络的安全性能,起到了隐藏身份的目的。
代理服务器分类
按所支持的协议来分,代理服务有HTTP代理、FTP代理、POP3代理等。
根据代理服务器的配置方案和工作方式,web代理服务器可以分为3中,传统代理方式,需要在客户端进行配置;透明代理,用于为内部网络主机提供外网的访问服务;反向代理,为外部网络上的主机提供内网的访问服务。
传统代理
传统代理需要在浏览器中进行代理设置,明确指出代理服务器的IP地址和网络端口。使得浏览器访问指定的服务时,先把访问请求发送给代理服务器。
透明代理
透明代理一般为内网计算机提供外网访问服务,不需要客户端做任何设置。透明代理阻断网络通信,并且过滤出访问外部的HTTP流量,如果客户端的请求在本地有缓存,则将缓存的数据直接发给用户,否则向远程服务器发出请求。对于linux操作系统,透明代理使用iptables来实现。
反向代理
反向代理能够代理外部网络上的主机访问内部网络(最常见的方式就是将防火墙后面的服务器提供给外网用户访问,有点像网关端口映射功能,将客户请求转发到相应主机端口上)。主要作用是承担对原始服务器的请求,防止原始服务器过载、实现URL策略、同时作为一个或几个本地网站的缓存加快了web服务器的响应速度。