万维网起源
1983年3月欧洲粒子物理研究所为让其分布在世界各地的成员能够方便的交流Tim Berners Lee带领小组进行研究设计
1990年10月,成功开发历史上第一个采用超文本技术设计的分布式信息系统,以WWW命名
一年后,该研究所向全世界宣布了万维网的诞生
www一出现便吸引了大量的研究者,一些人研制Web服务器程序,方便自己的信息通过Web向Internet提供;另一些人研制Web客户程序,设计具有多媒体功能的用户程序界面
1993年2月,用于Windows系统的浏览器Mosaic问世,使得web迅速风靡世界
诞生之初面临的问题
WWW上的信息资源分布在整个网络之上,每个站点上的资源都能独立进行管理,这就引发了一系列的问题:
(1)分布在Internet上的资源通过什么形式联系起来?
(2)不同系统间如何进行信息交流?
(3)怎样惟一地标识网络上某个站点上的某个资源?
(4)如何让不同的信息资源都能在统一的界面下显示,以消除不同系统的信息交流障碍。
WWW的开发者制定了一套标准的、易为人们掌握的超文本标记语言(HyperText Markup Language,HTML)、信息资源的统一资源定位器(Uniform Resource Locator,URL)和超文本传输协议(HyperText Transfer Protocol,HTTP),成功地解决了上述问题。WWW采用客户/服务器工作模式,其特点如下:
WWW概述
www不是一个独立于互联网的“另一个网络”,而是基于超文本和超媒体技术将许多信息资源链接而成的一个信息网。由节点和超链接组成,方便用户搜索、浏览信息,是互联网的一部分。
万维网工作模式采用B/S模式(浏览器、服务器)。
客户程序就是浏览器Browser,客户通过浏览器与服务器通信,发出请求,获得web服务器的响应,有时需要更复杂的处理,则需要访问其他服务器,如数据库服务器。浏览器获得响应后,对网页文件进行解释、显示等操作。
网络中专门运行服务器程序的节点称www服务器。在服务器上存放着以网页文件组织的资源,网页中使用超链接将分布在Internet上的资源联系起来。
网页是万维网进行信息组织的一种方式,采用超文本标记语言(HTML)编写。
该语言对文件的格式与显示作了详细规定,并引入超链接技术实现资源的互连
网页等信息资源存储在服务器上,www使用统一资源定位符URL来唯一标识每一个资源
并使用超文本传输协议实现客户端与服务器之间的信息发送与接收
超文本与超媒体
处理文本文件时,把文本中遇到的相关文本文件组织在一起,让计算机能够响应人的思维并能够方便的获取所需要的信息,这种方式称为超文本(HyperText)
超文本中使用“链接”把相关文本组织在一起,带有链接管理的文本通常用下划线和不同的颜色表示,通常把这种链接称为超链接(HyperLink),或者热链接(hot link)、超文本链接(HyperText Link)
<html>
<title>高老师大讲堂</title>
<body>
<p>我的课需要你认真听</p>
<a href="https://www.jianshu.com/u/3cc19c4e9735">我的简书</a>
</body>
</html>
传统文本一本按照线性结构组织,对文本处理按顺序方式进行;超文本则是按照非线性结构组织,将文档中相关内容的不同部分通过关键字建立超链接,可以随意的在文本之间跳转,且不受信息内容顺序与空间位置的限制,这种方式更接近人类的思维方式
超媒体(HyperMedia)是超文本与多媒体的结合,扩展了超链接所连接信息的类型,除文本外,可连接图形、图像、声音、动画、视频等
超媒体系统可分为集中式和分布式,集中式将所有文档存储在单一的计算机中,保证链接的有效性和一致性;分布式把文档分别存储在网络的不同节点上,由各自的计算机分别维护,因而可以及时更新、维护,但不能保证链接的有效性和一致性
www是典型的分布式超媒体信息系统,其网页使用超文本方式编写,网页中链接会突出显示,当鼠标对链接操作时会有一系列的变化
统一资源定位符URL
网络上的每个资源都有自己的标识(相当于地址),即统一资源定位符URL,或称为Internet地址或网址
URL是万维网协议组成部分,描述万维网客户程序在Internet上访问资源时所使用的访问方法、信息资源所在服务器名字及在该服务器上存放资源的路径名和文件名,相当于文件名在Internet上的扩展
URL一般格式(不区分大小写):
<访问方式>://<用户名>:<密码>@<主机>:<端口>/<路径>
主机项是必须的,指示提供某种Internet服务的服务器名字,可使用IP(可省略DNS解析过程),也可使用域名
用户名、密码、端口和路径中的某些或全部可以省略,省略内容使用浏览器默认值
用户名和密码用户访问有授权用户限制的服务器,默认情况下为匿名用户,大部分服务器允许匿名访问
端口指服务器提供服务的端口号,默认为各协议熟知的端口号
路径提供对特定资源访问的详细信息,默认为服务器系统指定的主目录的默认资源
URL默认协议为HTTP
www工作过程
www服务主要以网页形式呈现
网页又称HTML文档,扩展名为.html或.htm,使用HTML语言编写,组成网页的基本元素是文字、图形、图像和超级链接等
存放特定网页集合的服务器叫做网站,每个网站都有一个进入网站的起始页,叫做主页(HomePage)
一般www服务器会24小时运行服务器程序,及时响应用户请求,两者之间使用HTTP协议发送与接收数据。用户计算机连入Internet,运行浏览器程序,地址窗口输入正确网址
1.浏览器分析超链接指向页面的URL,获得服务器名字
2.浏览器向默认DNS请求分析服务器域名对应IP
3.DNS解析出目标IP并告知浏览器
4.浏览器使用IP与服务器连接
5.浏览器发出请求信息
6.www服务器响应用户请求并把相应网页发送给浏览器
7.浏览器接收页面所有数据,并断开服务器连接
8.浏览器显示网页内容,同时等待用户操作
超文本标记语言HTML
起源于通用标记语言(Standard for General Markup Language,SGML),这种语言支持各种网络环境之间、不同文件之间进行交流
HTML语言编写的文件以.html或.htm为扩展名,通常说网页
目前HTML语言版本是HTML4.0,H5也在迅速发展
支持文本、多媒体和超级链接功能,还支持多媒体选项、脚本语言、样式表、打印等其他功能
编写HTML文档通常可以手工直接编写或使用专门的网页开发工具
HTML是无格式文档,因此可以使用任何一种文本编辑器编写,例如notepad、写字板wordpad
也可以使用专用开发工具,例如微软的Frontpage、Adobe公司的pagemill、micromedia公司的Dreamweaver,这些工具软件的特点是所见即所得
HTML语法
word中的标题、字体、表格、段落等格式设计在HTML中被称为文档元素(Element),是文档的基本构件。HTML用一系列标签识别这些元素,HTML文档本身就是一个用<html>标签标记的文档元素
标签由三部分组成:左尖括号、标签名称和右尖括号
开始标签和结束标签通常成对出现,结束标签在标签名前加/(少数标签没有结束标签)
标签名称中字母不区分大小写
标签名有三种表示方法
<标签名>文本</标签名>
<标签名 属性名="属性值">文本</标签名>
<标签名>