一、简介
curl 是常用的命令行工具,用来请求 Web 服务器。它的名字就是客户端(client)的 URL 工具的意思。它的功能非常强大,命令行参数多达几十种。如果熟练的话,完全可以取代 Postman 这一类的图形界面工具。
二、命令
2.1 -A 和-H
# 不带有任何参数时,curl 就是发出 GET 请求。
curl https://www.example.com
# -A参数指定客户端的用户代理标头,即User-Agent。curl 的默认用户代理字符串是curl/[version]
curl -A 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36' https://google.com
# 命令会移除User-Agent标头。
curl -A '' https://google.com
# -H参数直接指定标头,更改User-Agent
curl -H 'User-Agent: php/1.0' https://google.com
2.2 -b 参数用来向服务器发送 Cookie
# 生成一个标头Cookie: foo=bar,向服务器发送一个名为foo、值为bar的 Cookie。
curl -b 'foo=bar' https://google.com
# 发送两个 Cookie
curl -b 'foo1=bar;foo2=bar2' https://google.com
# 读取本地文件cookies.txt,里面是服务器设置的 Cookie(参见-c参数),将其发送到服务器。
curl -b cookies.txt https://www.google.com
2.3 -c参数将服务器设置的 Cookie 写入一个文件
# 将服务器的 HTTP 回应所设置 Cookie 写入文本文件cookies.txt。
curl -c cookies.txt https://www.google.com
2.4 -d 参数 和 --data-urlencode
# -d参数用于发送 POST 请求的数据体。
curl -d'login=emma&password=123'-X POST https://google.com/login
# 或者 使用-d参数以后,HTTP 请求会自动加上标头Content-Type : application/x-www-form-urlencoded。并且会自动将请求转为 POST 方法,因此可以省略-X POST。
curl -d 'login=emma' -d 'password=123' -X POST https://google.com/login
# -d参数可以读取本地文本文件的数据,向服务器发送 读取data.txt文件的内容,作为数据体向服务器发送。
curl -d '@data.txt' https://google.com/login
# --data-urlencode参数等同于-d,发送 POST 请求的数据体,区别在于会自动将发送的数据进行 URL 编码。 发送的数据hello world之间有一个空格,需要进行 URL 编码。
curl --data-urlencode 'comment=hello world' https://google.com/login
2.5 -H参数添加 HTTP 请求的标头
# 添加 HTTP 标头Accept-Language: en-US。
curl -H 'Accept-Language: en-US' https://google.com
# 添加两个 HTTP 标头。
curl -H 'Accept-Language: en-US' -H 'Secret-Message: xyzzy' https://google.com
# 添加 HTTP 请求的标头是Content-Type: application/json,然后用-d参数发送 JSON 数据。
curl -d '{"login": "emma", "pass": "123"}' -H 'Content-Type: application/json' https://google.com/login
2.6 -F参数用来向服务器上传二进制文件
# 给 HTTP 请求加上标头Content-Type: multipart/form-data,然后将文件photo.png作为file字段上传。
curl -F 'file=@photo.png' https://google.com/profile
# -F参数可以指定 MIME 类型。指定 MIME 类型为image/png,否则 curl 会把 MIME 类型设为application/octet-stream。
curl -F 'file=@photo.png;type=image/png' https://google.com/profile
# -F参数也可以指定文件名。原始文件名为photo.png,但是服务器接收到的文件名为me.png。
curl -F 'file=@photo.png;filename=me.png' https://google.com/profile
2.7 -k参数指定跳过 SSL 检测
# 不会检查服务器的 SSL 证书是否正确。
curl -k https://www.example.com
2.8 -L参数会让 HTTP 请求跟随服务器的重定向。curl 默认不跟随重定向
如果直接使用 curl 打开某些被重定向后的链接,这种情况下就无法获取我们想要的网页内容。例如:
curl http://codebelief.com
会得到如下提示:
<html>
<head><title>301 Moved Permanently</title></head>
<body bgcolor="white">
<center><h1>301 Moved Permanently</h1></center>
<hr><center>nginx/1.10.3</center>
</body>
</html>
而当我们通过浏览器打开该链接时,会自动跳转到 http://www.codebelief.com。此时我们想要 curl 做的,就是像浏览器一样跟随链接的跳转,获取最终的网页内容。我们可以在命令中添加 -L 选项来跟随链接重定向:
curl -L http://codebelief.com
这样我们就能获取到经过重定向后的网页内容了。
2.9 使用linux的重定向功能保存
curl http://www.linux.com >> linux.html
2.10 使用curl的内置option:-o(小写)保存网页
curl -o linux.html http://www.linux.com
2.11 使用curl的内置option:-O(大写)保存网页中的文件
2.11.1 下载
curl -O http://www.linux.com/hello.sh
要注意这里后面的url要具体到某个文件,不然抓不下来
2.11.2 循环下载
curl -O http://www.linux.com/dodo[1-5].JPG
有时候下载图片可以能是前面的部分名称是一样的,就最后的尾椎名不一样,这样就会把dodo1,dodo2,dodo3,dodo4,dodo5全部保存下来。
2.11.3 下载重命名
curl -O http://www.linux.com/{hello,bb}/dodo[1-5].JPG
由于下载的hello与bb中的文件名都是dodo1,dodo2,dodo3,dodo4,dodo5。因此第二次下载的会把第一次下载的覆盖,这样就需要对文件进行重命名。
curl -o #1_#2.JPG http://www.linux.com/{hello,bb}/dodo[1-5].JPG
这样在hello/dodo1.JPG的文件下载下来就会变成hello_dodo1.JPG,其他文件依此类推,从而有效的避免了文件被覆盖。
2.11.4 分块下载
有时候下载的东西会比较大,这个时候我们可以分段下载。使用内置option:-r
curl -r 0-100 -o dodo1_part1.JPG http://www.linux.com/dodo1.JPG
curl -r 100-200 -o dodo1_part2.JPG http://www.linux.com/dodo1.JPG
curl -r 200- -o dodo1_part3.JPG http://www.linux.com/dodo1.JPG
cat dodo1_part* > dodo1.JPG
这样就可以查看dodo1.JPG的内容了
2.11.5 通过ftp下载文件
curl可以通过ftp下载文件,curl提供两种从ftp中下载的语法
curl -O -u 用户名:密码 ftp://www.linux.com/dodo1.JPG
curl -O ftp://用户名:密码@www.linux.com/dodo1.JPG
2.11.6 显示下载进度条
curl -# -O http://www.linux.com/dodo1.JPG
2.11.7 不会显示下载进度信息
curl -s -O http://www.linux.com/dodo1.JPG
2.11.8 断点续传
curl -C -O http://www.linux.com/dodo1.JPG
在windows中,我们可以使用迅雷这样的软件进行断点续传。curl可以通过内置option:-C同样可以达到相同的效果。如果在下载dodo1.JPG的过程中突然掉线了,可以使用以下的方式续传
2.12 测试网页返回值
curl -o /dev/null -s -w %{http_code} www.linux.com
在脚本中,这是很常见的测试网站是否正常的用法
2.13 指定proxy服务器以及其端口
curl -x 192.168.100.100:1080 http://www.linux.com
很多时候上网需要用到代理服务器(比如是使用代理服务器上网或者因为使用curl别人网站而被别人屏蔽IP地址的时候),幸运的是curl通过使用内置option:-x来支持设置代理
2.14 保存http的response里面的header信息。内置option: -D
curl -D cookied.txt http://www.linux.com
2.15 伪造referer(盗链)
curl -e "www.linux.com" http://mail.linux.com
很多服务器会检查http访问的referer从而来控制访问。比如:你是先访问首页,然后再访问首页中的邮箱页面,这里访问邮箱的referer地址就是访问首页成功后的页面地址,如果服务器发现对邮箱页面访问的referer地址不是首页的地址,就断定那是个盗连了curl中内置option:-e可以让我们设定referer,这样就会让服务器其以为你是从www.linux.com点击某个链接过来的
2.16 上传文件
curl不仅仅可以下载文件,还可以上传文件。通过内置option:-T来实现
curl -T dodo1.JPG -u 用户名:密码 ftp://www.linux.com/img/
这样就向ftp服务器上传了文件dodo1.JPG
2.17 显示抓取错误
curl -f http://www.linux.com/error
-w 指定输出内容
2.18 显示 HTTP 头
如果我们只想要显示 HTTP 头,而不显示文件内容,可以使用 -I 选项:
curl -I http://www.codebelief.com
输出为:
HTTP/1.1 200 OK
Server: nginx/1.10.3
Date: Thu, 11 May 2017 08:24:45 GMT
Content-Type: text/html; charset=utf-8
Content-Length: 24206
Connection: keep-alive
X-Powered-By: Express
Cache-Control: public, max-age=0
ETag: W/"5e8e-Yw5ZdnVVly9/aEnMX7fVXQ"
Vary: Accept-Encoding
也可以同时显示 HTTP 头和文件内容,使用 -i 选项:
curl -i http://www.codebelief.com
输出为:
HTTP/1.1 200 OK
Server: nginx/1.10.3
Date: Thu, 11 May 2017 08:25:46 GMT
Content-Type: text/html; charset=utf-8
Content-Length: 24206
Connection: keep-alive
X-Powered-By: Express
Cache-Control: public, max-age=0
ETag: W/"5e8e-Yw5ZdnVVly9/aEnMX7fVXQ"
Vary: Accept-Encoding
<!DOCTYPE html>
<html lang="en">
......
</html>