一个完整的分布式架构图
OSI七层模型和TCP/IP四层模型
1、 tcp的三次握手是为了建立连接,之后才开始通信传输数据;由于tcp是双工的(双向通信),会一直保持连接,所以数据传输完必须要双向关闭连接,所以才有4次挥手关闭连接。
tcp建立连接后在传输数据的过程中也是可靠的,因为A端向B端发送数据后,B端收到数据会向A端发送数据来确定收到数据的正确性。
2、DOS攻击是指在三次握手的第二次完成后,客户端停止向服务端发送第三次确认通信的握手,导致服务端一直等待阻塞,当数量达到服务器承受范围,服务器就崩溃了
3、socket不属于5层模型,本身并不是协议,是基于应用层与TCP/IP协议族通信的中间软件抽象层,是它的一组接口,TCP和UDP都支持,通过Socket,我们才能使用TCP/IP协议,(通常情况下Socket连接就是TCP连接)
应用层通过传输层进行数据通信时,TCP会遇到同时为多个应用程序提供并发服务的问题,多个TCP连接多个应用程序进程可能需要通过同一个TCP协议端口传输数据,为了区别不同的应用程序进程和连接,许多计算机操作系统为应用程序与TCP/IP协议交互提供了套接字(socket)接口,应用层可以和传输层通过socket接口区分来自于不同应用进程或网络连接的通信,实现数据传输的并发服务。
4、平时说的NIO、BIO、AIO都是针对本地电脑对数据的读写操作,而不是tcp的网络通信,http之所以会阻塞,是由于服务端发送给客户端的数据是存放在客户端的TCP接受缓冲区的,如果接受缓冲区的数据为空,则进程会一直等在那里直到有数据来。(netty NIO解决这个问题:专门有个调度线程来监控这个缓冲区是否有数据,而主线程不用一直等在那里,当有数据时监控线程会回调主线程)。
5、为什么要有序列化?
我们一般定义的类、对象,是放在内存中操作的,如果我们要保存到文件、持久化、传输等,必须要按照一定的约定格式转换出来,包含属性、值等,比如json、xml和java自带的序列化implements Serializable
6、java自带的序列化:结果数据大、传输效率低、不能跨语言。
一段时间内,xml对象序列化解决语言兼容、更易于理解,以至于基于xml的soap协议的webservice框架流行起来(WCF)
现在,基于JSON简单文本格式的HTTP REST接口基本取代webService。(但是json有占用空间大,传输性能低的问题)
7、serialVersionUID的作用
版本控制作用,在反序列化时,JVM传过来的字节流中的serialVersionUID会和当前的值比较,相等才能反序列化;如果没有定义,在编译成class文件时会自动随机生成一个。如果要兼容以前版本,得自己定义并且不去更改这个值;
8、主流序列化技术
xml:逐步淘汰
jackson:spring boot用的这个,支持属性注解、功能多,但是依赖3个包,代码封装不好
fastjson:阿里出品,代码封装好,生态不行
hessian2:dubbo用的这个,序列化速度比上面几个快很多,但是占用空间也大很多。
9、HTTPS:
安装浏览器会自带一些CA证书,访问不带https的网站,是没有ssl生成会话密钥这一步,传输数据都是明文;带https的网站,会首先生成ssl会话密钥,之后所有的请求传输都是加密的,(密钥只需要第一次生成)
HTTPS要使客户端与服务器端的通信过程得到安全保证,必须使用的对称加密算法,但是协商对称加密算法的过程,需要使用非对称加密算法来保证安全,然而直接使用非对称加密的过程本身也不安全,会有中间人篡改公钥的可能性,所以客户端与服务器不直接使用公钥,而是使用数字证书签发机构颁发的证书来保证非对称加密过程本身的安全。这样通过这些机制协商出一个对称加密算法,就此双方使用该算法进行加密解密。从而解决了客户端与服务器端之间的通信安全问题。(https://www.cnblogs.com/zhangshitong/p/6478721.html)
10、RPC架构图 和 RMI结构
常见RPC:RMI(Java独有,基于socket不能跨语言)、Dubbo(基于socket)、Thrif、Hessain、Webservice(基于 xml+ http 的soap)、grpc。
11、RPC和HTTP
HTTP通信比rpc简单、直接、开发方便,但依赖http协议,会传递很多无用报文,影响性能、效率、安全性。
如果一个系统服务多、接口多、通信量大。rpc比http会减少网络开销,而且一般有注册中心,有丰富的监控管理;发布、下线接口、动态扩展、重试机制等,对调用方来说是无感知、统 一化的操作。第三个来说就是安全性。最后就是最近流行的服务化架构、服务化治理,RPC框架是一个强力的支撑
rpc是一种概念,http也是rpc实现的一种方式;RPC也可以通过http来实现,比如谷歌的grpc,但是大部分都是基于socket来做的。
RPC的原理主要用到了动态代理模式。用http必须要服务端位于http容器里面,这样减少了网络传输方面 的开发