java劝退教程-硬件篇(三)
学习需要有大局观,我觉得正确的方式是从开始就对所学的知识有一个系统级别的认识,对这个知识体系有认识,这样才能知道自己学到哪,离自己的目标还有多远,而不是一上来就开始各种编码啊,设计模式啊,算法啊,结果学了些啥,有什么用,一概不知,产生 “我是谁?我在哪?” 这样的错觉,这样对学习积极性甚至是对所学知识产生系统的认识是无益的。
本篇文章对于初学者来说可能会有难度,但是没有关系,我们的目的只是了解,现阶段不需要完全理解透彻,当我们慢慢深入学习以后,这些知识会慢慢的掌握,当然,我也会用更容易理解的方法为大家讲解架构的故事,我们开始吧。
为什么系统需要架构这么多东西,一个服务器不够吗?
其实很多初学者都会有这样的一个疑问,这很正常,因为在我们学习的过程中,通常接触到的就是一个电脑,一个服务器,什么都可以往里面装,装完了直接调试,一个hello world 过去能跑通就大功告成,露出会心一笑,掌握一门新技术,深藏功与名。其实在学习和开发过程中,以上这种情况非常正确,但是在实际情况中就不一样了,为啥?再牛的服务器也架不住人多!
我们来看一组测试数据(数据来自网友测试,数据的准确性无关紧要,我们只看问题是怎么出现的)
Transaction Response Time Under Load
1可以看到在达到600用户同时在线的时候,系统响应时间为6秒钟
100人-----响应时间0.8秒 完美
150人-----响应时间1秒 完美
200人-----响应时间1.5秒 响应时间有微小波动 比较完美
250人-----响应时间1.8秒 比较完美(此时是理想情况下最大的并发用户数量)
280人-----开始出现连接丢失问题,连接开始不稳定
300人-----响应时间3秒 响应时间有较大波动峰值为6秒 较差
350人-----响应时间3秒 开始大量出现连接丢失问题 连接很不稳定
400人-----响应时间3.8秒 连接丢失数量达到3000次以上
450人-----响应时间4秒 连接丢失数量达到6000次以上
500人-----响应时间4秒 连接丢失数量达到11000次以上
550人-----响应时间6秒 连接丢失数量达到21000次以上
600人-----响应时间6秒 连接丢失数量达到25000次以上
600人开始系统出现异常情况,因此停止测试。测试数据到此为止。
单台tomcat容器在同时有280人访问的时候就开始出现页面打开延迟,达到600人的时候,你会发现浏览器转啊转啊转,就是不给你看页面,这就是为什么我们在开发中没问题,一上线就出问题的原因,因为用户量是会增长的。
那我们如何应对用户增长带来的问题呢?这就涉及到优化了,优化有多个层面,代码优化,软件优化,系统优化,架构优化。下面我们通过一张图简单的说一下架构的优化
图里面内容比较多,我们看看几个跟优化有关的地方
网络层 - 负载均衡
初学者经常听到专业名词就会懵,那么我们就用简单的语言介绍下专业的名词。
负载均衡:上图我们看到,在火车站售票窗口通常会同时打开很多个,方便大家购票,这时我们想象一下,如果只留一个窗口会发生什么情况。没有负载均衡的服务器就是一个售票窗口,当大量用户访问的时候,就会十分拥挤,十分卡,甚至告诉你别来买了,没票了。而负载均衡就好像是一个拿着喇叭的执勤大叔,“后面买票的去3号窗口,那边人少”,“5号窗的小姐姐都在打瞌睡了,你们没看见吗?后面排队的去5号窗!”。有了负载均衡,可以将网路请求均匀的分布到各个服务器上(上图的网络层服务器A,服务器B,服务器N就是多个服务器),让多个服务器都能处理用户请求。
展示层 - 静态化页面/页面缓存
我们可以看到架构是有很多层次的,越往下,越消耗时间和服务器资源,所以我们一般将很多不需要访问数据层的请求全部在展示层就返回,速度会提高很多。比如你在一楼,每次来个请求就要你爬7楼去拿个东西,是不是想想就累?你是不是会想,为啥东西不就放一楼,直接拿了就走,这跟展示层的静态缓存一个道理,不用干活,拿了就走,爽不。
业务层和服务层很重要 我们写的代码基本上都在这里,但是这个我们以后再说,我们来看看数据层。
数据库 - 内存数据库 关系数据库
大家肯定会很好奇,数据库就数据库,整这么多数据库干嘛?我们来简单介绍一下。
数据库一般都是由第三方的大公司开发的,不需要我们自己开发,而且数据库跟我们上面说的TOMCAT容器一样,也是有同时访问上限的,到了一定的访问量,数据库会说 “查不过来啦,别问我啦” 。这时候会有聪明的同学想到,那就多来几个数据库呗,的确是这样,你们看看数据层-关系型数据库 是不是就是有2个mysql。那么左边的内存数据库又是干啥的?我们看看数据库下面的箭头,里面有一行字 “热点数据 / 耗时数据” ,其实我们要知道,每次查询一次关系数据库成本是很大的,因为关系数据库在硬盘上面,我们上一篇文章说了,硬盘的读写效率相比内存来说很低,如果内存感觉是在高速,那么硬盘可能就是在堵车。所以我们的目标就是干脆不要去关系数据库查询数据,而是直接去内存查数据,把热点数据 (用户查询最多的数据) 放在内存里面,这样查询起来又不耗硬盘资源,速度还快。
好啦 硬件篇到这里就结束啦,同志们是不是想快点开始学编码了?NO NO NO,在那之前,我们很有必要了解一下操作系统,当我们将知识储备的更充实的时候,才是我们开始学习编码最好的时候。