静态、动态、伪静态网页、IP、PV、UV

1.什么是静态网页资源?

放在服务器上看到的是什么,显示的就是什么,一旦存于服务器上们就不会有任何改变

静态内容特点:

优点:

1.图片,附件,视频,前端页面语言,html,.js,.css,等

2.客户端解析(效率更高),而不是服务端解析。  #性能优化关键

                饭店是出示给你做好,放好调料,给你端过来,让你吃,叫服务端解析

                自主,火锅是你自己弄,叫客户端解析**

3.地址栏里没有特殊符号,比如&&、?符等等

4.网页发布一旦完成,就不会改变,(除非人工修改)这样客户更容易找到

5.静态网页存储地点:存储与(NFS)这样的服务里(共享存储)

6.内容来源(核心:用户上传:图片视频等;程序员开发的代码(.html,.js,.css))

7)网页程序在用户浏览器端解析,如IE浏览器,程序解析效率很高,由于服务端不进行解析,并且不需要读取数据库,因此服务器端可以接受更多的并发访问。当客户端向服务器请求数据时,服务器直接把数据从磁盘文件系统上返回(不做任何解析) ,待客户端拿到数据后,在浏览器端解析展现出来(优点) 。

缺点:

1.后端没有数据库。在网站制作和维护方面工作量较大,因此当网站信息量很大时,完全依靠静态资源网页制作的方式比较困难(缺点)

2)网页的交互性较差,在程序功能实现方面有较大的限制(缺点)

静态网页资源的对应程序及资源文件的常见扩展名为:

纯文本类程序或文件,如htm、html, xml, shtml、 js. css等。

图片类文件或数据文档,如jpg,gif, png, bmp,txt, doc, ppt等。

视频类流媒体文件,如mp4,swf, avi, wmv.flv等。

高并发的情况下必须用静态网页 (客户端自己解析)

在高并发、高访间量的场景下做架构优化,涉及的关键环节就是把动态网页转成静态网页,而不直接请求数据库和动态服务器,并且可以把静态内容推送到前端缓存(或CDN)中提供服务,这样就可以提升用户体验,节约服务器和维护成本。

动态网页六大特点:

0)动态资源网站链接中含有特殊符号,比如&&、?、等等

1)网页扩展名后缀常见为: .asp, .aspx,.php,.jsp,.do,.cgi等。

2)网页一般以数据库技术为基础,大大降低了网站维护的工作量。

3)采用动态网页技术的网站可以实现更多的功能,如用户注册、用户登录、在线调查、投票、用户管理、订单管理、发博文等等。

4)动态网页并不是独立存在于服务器上的网页文件,当用户请求服务器上的动态程序时,服务器解析这些程序并可能读取数据库返回一个完整的网页内容。

5)动态网页中的“?"在搜索引擎的收录方面存在一定的问题,搜索引擎一般不会从一个网站的数据库中访问全部网页,或者出于技术等方面的考虑,搜索蜘蛛一般不会去抓取网址中“?”后面的内容,因此在企业通过搜索引擎进行推广时,需要针对采用动态网页的网站做一定的技术处理(伪静态技术) ,以便适应搜索引擎的抓取要求。

6)程序在服务器端解析,这相当于顾客点餐,饭店厨师做饭做菜,耗时长,效率低。由于程序在服务端解析,因此,会消耗大量的CPU和内存、1/O等资源,并且多数还要读取数据库等服务,因此,其访问效率远不如静态网页,在服务端解析动态程序的服务常见的右pHp引整 lava容器(tamcat resin. iboss wehlooic)

总结:

静态效率高

动态消耗资源大

静态属于客户端解析

动态属于服务端解析

性能方面:静态好

功能方面:动态好

维护方面:动态好

高并发时,三者都得满足

什么是伪静态网页

伪静态就是通过某些技术(如rewrite)把动态网页的URL地址伪装成静态网页URL地址,但实质上用户访问的还是动态网页,只不过给用户看起来URL地址是符合静态网页地址特征的,因此,用户及某些搜索引擎会误认为是静态网页。

为什么要把动态页面做成伪静态页面?

动态网页链接中的“?、&&等特殊符号"在搜索引擎的收录方面存在一定的问题,搜索引擎一般不会从一个网站的数据库中访问全部网页,或者出于技术等方面的考虑,搜索蜘蛛一般不会去抓取网址中“?”后面的内容,因此在企业通过搜索引擎进行推广时,需要针对采用动态网页的网站做一定的技术处理(伪静态技术) ,以便适应搜索引擎的抓取要求。

伪静态网页特点

从网站的URL地址看,伪静态表面上看起来是静态内容(如地址结尾带html,连接中无特殊符号) ,这是通过rewrite规则来实现的URL地址重写。改写后的URL地址规范、美观,有利于搜索引擎抓取,以及提升用户访问体验。如: http://oldboy.blog.51cto.com/2561410/803606和 http://www.discuz.net/forum-3967-1.html这样的两个地址都是伪静态的。因为伪静态网页还是动态网页,从性能上考虑,伪静态功能不但没有提升网站性能,反而会降低网站的性能。这一点读者要理解。那么,有些读者可能就会有疑问了,为什么动态网页需要伪装成静态呢?为什么不能直接转成静态网页呢?

伪静态网页作用

由于搜索引擎无法正确读取带参数的动态网页内容,造成网页中很多具有丰富信息的页面无法被搜索引擎收录,因此才有了伪静态技术,它的作用是把动态网页URL改写成静态网页的URL,虽然同样是消除了动态网页中的参数,但是并不需要生成任何网页,仅仅是改变了网页地址路径,这样做的主要目的有两个,一是让搜索引擎收录网站内容,实现让更多的用户访问企业网站内容,二是提升用户访问体验,动态地址带特殊符号等的URL看起来也不如看着静态网页地址舒服。

伪静态网页的缺点

动态网页伪装静态网页,虽然可以让搜索引擎收录,并且可提升用户访问体验,但伪静态网页并不能提升网站的访问效率性能,从理论上说还会降低网站的性能,没有动态转静态网页效率高,但是对于一些并发不是超大的情况来说,或者是硬件资源充足的情况来说,伪静态还是一个不错的实用功能,因为,要把动态网页真正地转成静态网页,不是一朝一夕的事情,需要技术团队通力配合才能行。

现在很多大型的网站都采用了动态网页生成静态网页的技术,消除动态网页中的参数,使搜索引擎收录更多的内容,达到优化网站的效果。当网站遇到访问瓶颈时,如果有技术力量将动态网页转化成静态网页,那就再好不过了,但是,有些更新频率很快的业务并不适合这么做,或者将动态转为静态有很大难度,这时就可以考虑设置伪静态。相关架构内容可以参加老男孩老师高级架构师课程内容。

伪静态网页小结

利用rewrite技术将动态网页伪装成静态网页(URL地址改写).

便于搜索引擎搜录提升用户访问量以及用户体验

访问性能没有提升,并且转换伪静态会消耗资源,因此性能反而会下降.

如果为了性能,就尽可能将动态网页转换成真正的静态页面。

并发量不是很大或者动态更新过于频繁的时候,用rewrite实现伪静态也是不错的

伪静态网页的实现过程,一般是由运营产品提出需求,开发和运维共同实现的。

门户新闻业务

新闻网站的特点是一旦发布完成,几乎不会再改动网页内容。因此,对于新闻业务内容的静态化相对比较简单。

第一步:程序要支持发布动态内容转成静态功能。

第二步:运营编辑人员发布新闻网页(内容进数据库,图片、视频进入存储)后,后台程序立刻将动态网页生成静态文件(生成html文件放到存储上) 。

第三步:运维人员通过发布或事件触发把运营编辑生成的静态网页发布到事先搭建好的公司缓存集群服务器上,或者把静态内容同步到购买的全国所有CDN服务器节点上,然后,再提供给用户提供访问浏览。

利用CDN加速:



2.视频网站业务

视频网站和新闻网站类似,特点都是一旦发布完成,几乎不会再改动网页内容。因此,实现视频业务网站高效访问也很简单。

以优酷视频网为例,用户在上传视频时,需要经历转码→审核的过程(大概1个小时),然后一些热点视频也可能会被提前推送同步到CDN的核心节点或全国所有CDN服务器节点,用户访问时才会更快。

1)凡是发布后不需要再改的网站业务,都可以直接静态化,(一台顶十台)

      或者需要改也行,但前提是公司内部人员更改。(重新静态化的过程)

2)用户上传修改,然后还实时要求高。静态化最难,如::

Blog/BBS/SNS/微博社区业务/电商(如淘宝、京东)

这几类业务的动态转静态是比较困难的,因为,用户发布完成内容,可能会随时更新并查看,这种情况一般会通过异步方式,例如消息中间件技术加上NoSQL集群技术实现实现转换,当然也会改进产品细节,例如:在访问的环节设置延时、异步加载等手段,

较为详细的说明见如博客“浅谈千万级PVIP规模高性能高并发网站(http://oldboy.blog.51cto.com/2561410/736710和http://edu.5 1cto.com/course/course id-3093.html)

上边这个博客看一下^

生产Web架构优化实战方案

由于静态网页程序在客户端解析,大大降低了服务器端的访问压力,因此解析效率更高,在实际高并发网站架构中,可以考虑把用户请求的数据解析后存成静态文件放于磁盘中或放于内存中,来降低动态服务器的压力,节约企业成本,提升用户体验。

有关高并发网站架构从动态转静态的内容,可以参考老男孩老师的文章“浅谈千万级PV/IP规模高性能高并发网站架构” : http://oldboy.blog.51cto.com/2561410/736710 

下面介绍几个高并发网站架构从动态转静态不用更改企业业务产品代码就可以实现的例子。

用户上传的内容了,然后还要修改,然后还要实时访问,把他静态化最难,思路如下:


IP\PV\UP的区别

IP就是一个公网地址,我们教室访问公网时,用的是一个IP。以天为单位

pv就是浏览页面的次数,打开一个页面算一个pv,不管几个用户访问。现在一般把pv的统计程序放到页面的最下边,也就是必修浏览页面到低,才会计入一次pv,防止刷pv。

老师的公司的服务器一天五千万pv,也就是浏览量五千万

百度一天千亿pv,也就是一天浏览量五千亿次

UV 就是是每台计算机访问时,系统自动给这台计算机一个Cookie,按照计算机的量来定UV

企业网站对IP, PV, UV的度量

对IP的度量:

分析所有Web服务器的访问日志信息,对IP地址段去重后计数,这是IT人员的基本计算手段。

在网站的每一个(所有)页面结尾,嵌入JS等统计程序代码,待用户加载网页后, IP即传给统计IP的服务器,这种方法一般被第三方统计公司或企业内部开发日志分析程序时使用。

用第三方大家比较信任的统计工具例如:谷歌的统计(GA).

对PV的度量如下:

分析Web服务的访问日志(需要排除js.css及各种图片的日志信息),只计算HTML.PHP等页面数量。

在网站的每一个页面结尾,嵌入Js等统计程序代码,待用户加载网页后,访问数量即传给统计PV的服务器,这种方法一般被第三方统计公司或在企业内部开发日志分析程序时使用

用第三方大家比较信任的统计工具例如:谷歌的统计(GA) 。

UV度量:

通过Cookie鉴别。当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发出一个Cookie,通常放在这个客户端电脑的C盘当中。在这个Cookie中会分配一个独一无二的编号,这其中会记录一些访问服务器的信息,如访问时间、访问了哪些页面,等等。当你下次再访问这个服务器的时候,服务器就可以直接从你的电脑中找到上一次放进去的 Cookie文件,并且对其进行一些更新,但那个独一无二的编号是不会变的。如果在一定时।间内,服务器发现2个来访者对应的是一个编号,那么自然可以认为它来源于同一个来访者了,于是就计算1个UV.

网站流量统计工具软件

PWIKI   awstats    ELK收集日志。

在线统计流量工具。

并发连接:::

A种理解:网站服务器每秒能够接收的最大用户请求数。

B种理解:网站服务器每秒能够响应的最大用户请求数。

C种理解:网站服务器在单位时间内能够处理的最大连接数。

虽然A. B的理解占IT人员中的大多数,但是,按照老男孩的理解, C种理解更为准一些。

就在这一刻,可以接受最大的访问量,叫最高并发连接

每秒内,承受处理最大的连接数,叫做并发连接

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容

  • 一、静态网页资源 1.静态网页资源介绍 在网页设计上,纯粹HTML格式的网页(可以包含图片、视频、JS(前端功能实...
    藏鋒1013阅读 1,384评论 0 2
  • 静态网页资源 什么是静态网页资源?静态网页资源是开发者编写的,放在服务器上看到的是什么显示的就是什么,一旦编写完成...
    阿昊v阅读 839评论 0 1
  • 老男孩Linux运维读书笔记 HTTP服务基础 用户访问网站基本流程 1,客户端输入网站地址;2,本地缓存或hos...
    Zhang21阅读 742评论 0 3
  • 感恩晓玉老师分享《玩转社群的九大招数》,九个技巧让你在朋友圈当中成为醒目的人,快速与群友熟悉,吸引好友,打造高质量...
    梧桐70阅读 419评论 0 1
  • 朋友的同事也不是什么坏人,甚至某些方面还挺不错的,但却爱占小便宜。 每次不管谁请客,她都忘不了带上自己的孩子。一次...
    张家二YY阅读 408评论 0 0