1. Squid是什么?
Squid是一个高性能的代理缓存服务器,Squid支持FTP、gopher和HTTP协议。和一般的代理缓存软件不同,Squid用一个单独的、非模块化的、I/O驱动的进程来处理所有的客户端请求。
Squid可运行在大多数Unix和OS/2版本的系统之上,已知的可工作的有:Windows,AIX,Digital Unix,FreeBSD,HP-UX,Irix,Linux,NetBSD,Nextstep,SCO,Solaris
初始版本 1996年7月
稳定版本 3.5.27(2017年8月19日,8天前)
预览版本 4.0.21(2017年7月2日,56天前)
2. 主要功能
- 缓存网站内容,以达到分担源站压力加快访问速度的目的。
- 热点缓存,只缓存访问热度到达设定级别的网站内容。
- 合并回源,多个相同的请求只回源一次。
- ACL访问控制,可针对源IP、目的地IP、域名、URL、访问时间、单一最大连接数限制访问行为。或通过外部程序验证访问者(proxy_auth)。
- 主要支持协议:HTTP、HTTPS、FTP
- 网页内容篡改,可根据需求篡改网站内容。
- 网站头部篡改,可根据需求篡改请求头部。
- 可针对不同的域名或url配置不同的缓存规则。
3. 应用场景
- 正向代理(本地网关)
- 正向代理的典型用途是为在防火墙内的局域网客户端提供访问Internet的途径。
- 正向代理还可以使用缓存特性减少网络使用率。
- 正向代理允许客户端通过它访问任意网站并且隐藏客户端自身,因此你必须采取安全措施以确保仅为经过授权的客户端提供服务。
- 透明代理(cdn,架设于网络运营商主干机房)
- 提高各个地区访问者的访问速度。
- 减少源站压力。
- 减少网络运营商的网间结算费用。
- 节省网络运营商带宽资源。
- 反向代理(网站前端)
- 降低源站服务器的负载。
- 隐藏源站真实ip。
4. 缓存状态日志
TCP_HIT
Squid发现请求资源的貌似新鲜的拷贝,并将其立即发送到客户端。TCP_MISS
Squid没有请求资源的cache拷贝。TCP_REFERSH_HIT(squid3.0改为TCP_REFRESH_UNMODIFIED)
Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。原始服务器返回304(未修改)响应,指示squid的拷贝仍旧是新鲜的。TCP_REF_FAIL_HIT
Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。然而,原始服务器响应失败,或者返回的响应Squid不能理解。在此情形下,squid发送现有cache拷贝(很可能是陈旧的)到客户端。TCP_REFRESH_MISS(squid3.0改为TCP_REFRESH_MODIFIED)
Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。原始服务器响应新的内容,指示这个cache拷贝确实是陈旧的。TCP_CLIENT_REFRESH_MISS
Squid发现了请求资源的拷贝,但客户端的请求包含了Cache-Control: no-cache指令。Squid转发客户端的请求到原始服务器,强迫cache确认。TCP_IMS_HIT
客户端发送确认请求,Squid发现更近来的、貌似新鲜的请求资源的拷贝。Squid发送更新的内容到客户端,而不联系原始服务器。TCP_SWAPFAIL_MISS
Squid发现请求资源的有效拷贝,但从磁盘装载它失败。这时squid发送请求到原始服务器,就如同这是个cache丢失一样。TCP_NEGATIVE_HIT
在对原始服务器的请求导致HTTP错误时,Squid也会cache这个响应。在短时间内对这些资源的重复请求,导致了否命中。negative_ttl 指令控制这些错误被cache的时间数量。请注意这些错误只在内存cache,不会写往磁盘。下列HTTP状态码可能导致否定cache(也遵循于其他约束): 204, 305, 400, 403, 404, 405, 414, 500, 501, 502, 503, 504。TCP_MEM_HIT
Squid在内存cache里发现请求资源的有效拷贝,并将其立即发送到客户端。注意这点并非精确的呈现了所有从内存服务的响应。例如,某些cache在内存里,但要求确认的响应,会以TCP_REFRESH_HIT, TCP_REFRESH_MISS等形式记录。TCP_DENIED
因为http_access或http_reply_access规则,客户端的请求被拒绝了。注意被http_access拒绝的请求在第9域的值是NONE/-,然而被http_reply_access拒绝的请求,在相应地方有一个有效值。TCP_OFFLINE_HIT
当offline_mode激活时,Squid对任何cache响应返回cache命中,而不用考虑它的新鲜程度。TCP_REDIRECT
重定向程序告诉Squid产生一个HTTP重定向到新的URI(见11.1节)。正常的,Squid不会记录这些重定向。假如要这样做,必须在编译squid前,手工定义LOG_TCP_REDIRECTS预处理指令。NONE
无分类的结果用于特定错误,例如无效主机名。
UDP_HIT
Squid在cache里发现请求资源的貌似新鲜的拷贝。UDP_MISS
Squid没有在cache里发现请求资源的貌似新鲜的拷贝。假如同一目标通过HTTP请求,就可能是个cache丢失。请对比UDP_MISS_NOFETCH。UDP_MISS_NOFETCH
跟UDP_MISS类似,不同的是这里也指示了Squid不愿去处理相应的HTTP请求。假如使用了-Y命令行选项,Squid在启动并编译其内存索引时,会返回这个标签而不是UDP_MISS。UDP_DENIED
因为icp_access规则,ICP查询被拒绝。假如超过95%的到某客户端的ICP响应是UDP_DENIED,并且客户端数据库激活了(见附录A),Squid在1小时内,停止发送任何ICP响应到该客户端。若这点发生,你也可在cache.log里见到一个警告。UDP_INVALID
Squid接受到无效查询(例如截断的消息、无效协议版本、URI里的空格等)。Squid发送UDP_INVALID响应到客户端。
5. squidclient是什么?
squidclient是提供用于检索URL的命令行工具。 专为测试任何HTTP 0.9,1.0或1.1 Web服务器或代理而设计。 该工具可以与脚本组合,以执行任何基本的HTTP操作。 提供了一些用于访问squid代理对象缓存和管理信息的附加功能。
6. 安装aquidclient
- 在Debian或Ubuntu下
#apt-get install squidclient
- 在Redhat或Centos下
yum install squidclient
7.常用squidclient命令
squidclient -h #查看帮助
squidclient -p 80 mgr:info #取得squid运行状态信息
squidclient -p 80 mgr:mem #取得squid内存使用情况
squidclient -p 80 mgr:objects #取得squid已经缓存的列表(谨慎使用,量大时容易崩溃)
squidclient -p 80 mgr:diskd #取得squid的磁盘使用情况
squidclient -p 80 -m PURGE http://www.php-oa.com/static.php #强制更新某个url
squidclient -p 80 mgr:io #取得squid io情况
squidclient -p 80 mgr:ipcache #查看squid缓存的dns解析记录
squidclient -p 80 mgr:info|grep Aver #查看端口连接数
squidclient http://www.baidu.com/100.html #测试访问
squidclient -p 80 mgr:traffic #查看流量
squidclient -p 80 mgr:404 #取5分钟内404错误请求的个数
squidclient -p 80 mgr:status #取5分钟内各种返回码的个数