1 什么是RPC
目前,稍微大一点的公司中,系统都是由大大小小的服务器组成,各服务部署在不同的机器上,由不同的团队负责。这时候就会遇到两个问题:
- 服务依赖在远端设备上,这个时候如何调用?
- 如何提供自身的服务给其他团队使用?
RPC(Remote Procedure Call Protocol),远程调用协议就是为了解决这种问题存在的,它是一种从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP/UDP等,为通信程序之间携带信息数据,在OSI网络通信模型中,RPC跨越了传输层和应用层。RPC使得开发包括网络分布式多程序在内的应用程序更加容易。
简单讲,就是两台服务器A和B,一个应用部署在A上,想要调用B服务器上应用提供的方法/函数,由于不再一个内存空间,不能直接调用,需要通过网络来表达调用的语义和传达调用的数据。
1.1.1 问题
- 通信问题, 通过在客户端和服务器器之间建立TCP连接,远程过程调用的所有交换的数据都在这个链接里面传输。连接可以是按需连接,调用结束后就断掉,也可以是长连接,多个远程调用共享一个链接。
- 寻址问题,A设备告诉底层RPC框架,如何连接到B设备(主机或IP地址),以及特定的端口,函数名称是什么
- 传参需要通过底层的协议传递到远端设备,因此,参数需要序列化成二进制形式传输。
- 远端设备需要对收到的请求进行反序列化操作,找到对应的方法,进行本地调用
- 返回值再序列化之后,发回给A,A再反序列化之后交给对应应用
1.1.2 RPC原理
1.1.2.1RPC过程
其中,stub就是负责参数到二进制流之间的编码与解码。
1.1.2.2序列化与反序列化
Client与Server端之间网络传输的是二进制流,那么为了保证调用,就必须将消息结构进行编码与解码。
如今的序列化方案有很多种,从RPC角度上看,主要需要考虑以下三点:
- 通用性
- 性能
常见RPC包括:
- 阿里巴巴的hsf,Dubbo(开源)
- Facebook的thrift(开源)
- Google的grpc(开源)
- Twitter的finagle
这些后面我们将有其他文章来分析。
2 Protocol Buffers
Google Protocol Buffer是Google公司内部的混合语言数据标准,它是一种轻便高效的结构化数据存储格式,可以用于结构化数据的序列化处理,很适用于做数据存储或RPC数据交换格式。可用于通讯协议、数据存储等领域的语言无关,平台无关、可扩展的序列化结构数据格式。
当然,除了protobuf之外,当前序列化的标准还有好多种,如xstream, json, xml, jdk, hessian等等。Protobuf相对于这些xml和json等,具有如下优点:
- 简洁
- 体积小,消息大小只要xml的1/10到1/3
- 速度快,解析速度比xml快20~100倍
- 使用protobuf的编译器,可以方便的生成程序代码
- 更好的兼容性,protobuf设计的一个原则就是要能够很好的支持乡下或向上兼容
3 实验
我们使用Python来简单实验一下RPC
3.1.1 环境
Server: 192.168.23.73:8000
Client:
3.1.2 代码
3.1.2.1 Server代码
from SimpleXMLRPCServer import SimpleXMLRPCServer
def is_even(n):
return ((n % 2) == 0)
server = SimpleXMLRPCServer(("192.168.23.73", 8000))
print "Listening on port 8000..."
server.register_function(is_even, "is_even")
server.serve_forever()
3.1.2.2 Client代码
import xmlrpclib
proxy = xmlrpclib.ServerProxy("http://192.168.23.73:8000/")
print "3 is even : %s" % str(proxy.is_even(3))
print "100 is even : %s" %str(proxy.is_even(100))
3.1.3 运行结果
下图分别显示了服务端和客户端的运行结果:
服务端监听8000端口
客户端调用服务端提供的函数