与URI(统一资源标识符)相比,我们更熟悉URL(Uniform Resource Locator,统一资源定位符)。URL正是使用Web浏览器等访问Web页面时需要输入的网页地址。
URI:统一资源标识符
URI是Uniform Resource Identifier的缩写。RFC2396分别对这3个单词进行了如下定义。
- Uniform
规定统一的格式可方便处理多种不同类型的资源,而不用根据上下文环境来识别资源指定的访问方式。另外,加入新增的协议方案也更容易。 - Resource
资源的定义是“可标识的任何东西”。除了文档文件、图像或服务等能够区别于其他类型的,全都可作为资源。另外,资源不仅可以是单一的,也可以是多数的集合体。 - Identifier
表示可标识的对象。也称为标识符。
综上所述,URI就是由某个协议方案表示的资源的定位标识符。协议方案是指访问资源所使用的协议类型名称。
URL:统一资源定位符
URI用字符串标识某一互联网资源,而URL表示资源的地点(互联网上所处的位置)。可见URL是URI的子集。
URI格式
表示指定的URI,要使用涵盖全部必要信息的绝地URI、绝地URL以及相对URL。相对URL,是指从浏览器中基本URI处指定的URL,形如/image/logo.gif
让我们先来了解一下绝地URI的格式。
http://user:pass@www.example.jp:80/dir/index.htm?uid=1#ch1
- 协议方案名:http://
使用http:或https:等协议方案名获取访问资源时要指定协议类型。不区分字母大小写,最后附一个冒号(:)。
也可使用data:或javascript:这类指定数据或脚本程序的方案名。 - 登录信息(认证):user:pass
指定用户名和密码作为从服务器端获取资源时必要的登录信息(身份认定)。此项是可选项。 - 服务器地址:www.example.jp
使用绝地URI必须指定待访问的服务器地址。地址可以是类似hackr.jp这种DNS可解析的名称,或是192.168.1.1这类IPv4地址名,还可以是用方括号括起来的IPv6地址名。 - 服务器端口号:80
指定服务器连接的网络端口号。此项也是可选项,若用户省略则自动使用默认端口号。 - 带层次的文件路径:dir/index.htm
指定服务器上的文件路径来定位特指的资源。这与UNIX系统的文件目录结构相似。 - 查询字符串:uid=1
针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数。此项可选。 - 片段标识符:#ch1
使用片段标识符通常可标识出已获取资源中的子资源(文档内的某个位置)。但在RFC中并没有明确规定其使用方法。该项也为可选项。