静态网页资源
什么是静态网页资源?
静态网页资源是开发者编写的,放在服务器上看到的是什么显示的就是什么,一旦编写完成就不会改变。
静态内容特点:
1、图片、附件、视频、前段页面语言。html、js、css等
2、客户端解析,而不是服务端解析。 #性能优化的关键
例如:去饭店吃饭,是厨师做菜,而不是客户做,叫做服务端解析。
自助,火锅店更倾向于客户端解析,碗筷分类扔到指定地点
客户端解析效率更高
3、后端没有数据库。
4、地址治理没有特殊符号,例如&& ? 等
5、发布网页一旦发布完成,就不会改变,除非人工修改。
6、存储地点,存储于NFS这样的服务里(共享存储)
7、内容来源(核心:用户上传:图片和视频等;程序员开发的代码(.html,js,css))
动态网页资源
1·动态网页资源介绍
所谓的动态网页是与静态网页相对而言的,也就是说,动态网页的URL后缀不是htm, .html, .shtml, .xml, js, .css等静态r的常见后缀扩展名形式,而是以.asp, aspx, php,js. .do, .cgi等形 s,并且一般在动态网页网址中会有标志性的符号-"?, &" ,此外,在大多数情况下后端都需要有数据库支持等。
动态网页7大优点
1)网页扩展名后缀常见为: .asp. .aspx. .php. jsp..do,.cgi等。
2)网页一般以数据库技术为基础,大大降低了网站维护的工作量。
3)采用动态网页技术的网站可以实现更多的功能,如用户注册、用户登录、在线调查、投票、用户管理、订单管理、发博文等等。
4)动态网页并不是独立存在于服务器上的网页文件,当用户请求服务器上的动态程序时,服务器解析这些程序并可能读取数据库返回一个完整的网页内容。
5)动态网页中的“?”在搜索引擎的收录方面存在一定的问题,搜索引擎一般不会从一个网站的数据库中访问全部网页,或者出于技术等方面的考虑,搜索蜘蛛一般不会去抓取网址中“?"后面的内容,因此在企业通过搜索引擎进行推广时,需要针对采用动态网页的网站做一定的技术处理(伪静态技术) ,以便适应搜索引擎的抓取要求。
6)程序在服务器端解析,这相当于顾客点餐,饭店厨师做饭做菜,耗时长,效率低。由于程序在服务端解析,因此,会消耗大量的CPU和内存、1O等资源,并且多数还要读取数据库等服务,因此,其访问效率远不如静态网页
7)在服务端解析动态程序的服务常见的有PUP阴晴,java容器(tomcat、resin、jboss、weblogic)Python软件。
高并发的网站三个都重要:
性能考虑
维护考虑
功能考虑
伪静态网页
伪静态网页介绍
如标题字义,伪静态就是通过某些技术(如rewrite)把动态网页的URL地址伪装成静 , 态网页URL地址,但实质上用户访问的还是动态网页,只不过给用户看起来URL地址是符合静态网页地址特征的,因此,用户及某些搜索引擎会误认为是静态网页。
伪静态网页特点
从网站的URL地址看,伪静态表面上看起来是静态内容(如地址结尾带html) ,这是通过rewrite规则来实现的URL地址重写。改写后的URL地址规范、美观,有利于搜索引擎抓取,以及提升用户访问体验。如: http://oldboy.blog.51cto.com/2561410/803606和 http://www.discuz.net/forum-3967-1.html这样的两个地址都是伪静态的。因为伪静态网页还是动态网页,从性能上考虑,伪静态功能不但没有提升网站性能,反而会降低网站的性能。这一点读者要理解。
伪静态网页缺点
动态网页伪装静态网页,虽然可以让搜索引擎收录,并且可提升用户访问体验,但伪静态网页并不能提升网站的访问效率性能,从理论上说还会降低网站的性能,没有动态转1静态网页效率高,但是对于一些并发不是超大的情况来说,或者是硬件资源充足的情况来说,伪静态还是一个不错的实用功能,因为,要把动态网页真正地转成静态网页,不是一朝一夕的事情,需要技术团队通力配合才能行。现在很多大型的网站都采用了动态网页生成静态网页的技术,消除动态网页中的参数,使搜索引擎收录更多的内容,达到优化网站的效果。当网站遇到访问瓶颈时,如果有技术力量将动态网页转化成静态网页,那就再好不过了,但是,有些更新频率很快的业务并不适合这么做,或者将动态转为静态有很大难度,这时就可以考虑设置伪静态。
伪静态网页小结
利用revrite技术将动态网页伪装成静态网页(URL地址改写) 。
便于搜索引擎搜录提升用户访问量以及用户体验。
访问性能没有提升,并且转换伪静态会消耗资源,因此性能反而会下降。
尽可能将动态网页转换成真正的静态页面。
并发量不是很大或者动态更新过于频繁的时候,用rewrite实现伪静态也是不错的。
伪静态网页的实现过程,一般是由运营产品提出需求,开发和运维共同实现的。
门户新闻业务
新闻网站的特点是一旦发布完成,几乎不会再改动网页内容。
因此,对于新闻业务内容的静态化相对比较简单。
第一步:程序要支持发布动态内容转成静态功能。
第二步:运营编辑人员发布新闻网页后,后台程序立刻将动态网页生成静态文件。
第三步:运维人员通过发布或事件触发把运营编辑生成的静态网页发布到事先搭建好的公司缓存集群服务器上,或者把静态内容同步到购买的全国所有CDN服务器节点上,然后,再提供给用户提供访问浏览。
视频网站业务
视频网站和新闻网站类似,特点都是一旦发布完成,几乎不会再改动网页内容。因此,实现视频业务网站高效访问也很简单。
以优酷视频网为例,用户在上传视频时,需要经历转码一审核的过程(大概1个小时),然后一些热点视频也可能会被提前推送同步到CDN的核心节点或全国所有CDN服务器节点, НРia时才更快。
1)凡是发布后不需要再改的网站业务员,都可以直接静态化(1台顶十台服务器)
或者需要改也行,但是由公司内部人员也可以直接静态。
2)由用户来上传修改,然后还实时要求高。静态化最难。
1、让发布人能够实时看到,直接访问动态(查数据库和储存)
2、让其他人找静态
网站流量度量
网站访问量:IP (Internet Protocol) :
一个带有公网1的电脑访问IP (独立IP)即InternetProtocol,这里指独立IP数,独立1P数是指不同IP地址的计算机访问网站时被计算的总次数。独立IP数是衡量网站流量的一个重要指标。一般一天内(00:00-24:00)相同IP地址的客户端访问区站页面只被计算为一次,记录独立IP的时间可为一天或一个月, 目前通用的标准为“一天"。
PV(Page view)
PV (访问量)即Page View,中文翻译为页面浏览,即页面浏览量或点击量,不管客户端是不是相同,也不管IP是不是相同,用户每次访问一个网站页面都会被计算一个PV。PV的具体度量方法就是从客户浏览器发出一个对Web服务器的请求(Request), Web服务器接到这个请求后,将该请求对应的一激页(Page)发送给浏览器,就产生了一个 PV。这里有一个问题,就是只要这个请求感网并翻划览器,无论这个页面是否完全打开(或下载完成) ,那么都是会被计数为1个PV (服务器日志 ,一般为了防止用户快速刷PV,很多网站把PV的统计程序放在页面的最下面。
UV(独立访客)即Unique
UV (独立访客)即Unique Visitor,同一台客户端(PC或移动端)访问网站被计算大一个访客。
一天(00:00-24:00)内相同的客户端访问同一个网站只计算一次UV. UV一般是以客户端Cookie等技术作为统计依据的,实际统计会有误差。
考虑到一台客户端电脑可能会有多人使用的情况,因此, UV (独立访客)实际上并不定是独立的自然人访问。
企业网站对IP、PV、UV的度量
先来看对IP的度量
分析所有Web服务器的访问日志信息,对IP地址段去重后计数,这是IT人员的基本计算手段。
在网站的每一个(所有)页面结尾,嵌入Js等统计程序代码,待用户加载网页后, IP即传给统计IP的服务器,这种方法一般被第三方统计公司或企业内部开发日志分析程序时使用。列如:谷歌的统计(GA)。
网站流量统计工具:
工作场景:
统计并发数的基本方法
1、统计当下时刻的Linux的网络连接数并发, netstat-anlgrep-i" est"wc-1
2、 nginx web active status
每秒内网站可以最大处理的连接数,叫做并发连接数。
IP/PV/并发/台数:
1万/5-10万/200/1
web服务软件:
1、静态软件: Nginx(Tengine)、Apache,Lighttpd
2、动态软件: php程序(Php引擎)、JAVA程序(tomcat/resin/jboss/weblogic)、 python程序(Python)