本文我们用 Python 来实现一个client-Server的简单的程序,在开始写具体的程序之前,我们看一下网络中两个应用程序是如何通信的.
1. 网络应用程序是如何通信的
我们回顾一下经典的 TCP/IP 网络分层模型。从字面意思来看TCP/IP是TCP和IP协议的合称,但实际上TCP/IP协议是指因特网整个TCP/IP协议族。不同于ISO模型的七个分层,TCP/IP协议参考模型把所有的TCP/IP系列协议归类到四个抽象层中,每一抽象层建立在低一层提供的服务上,并且为高一层提供服务,如下图所示:
下面分别介绍一下各个层的主要作用:
1)网络接口层:网络接口层与OSI参考模型中的物理层和数据链路层相对应。
2)网际互联层:网际互联层对应于OSI参考模型的网络层,主要解决主机到主机的通信问题。该层有四个主要协议:网际协议(IP)、地址解析协议(ARP)、互联网组管理协议(IGMP)和互联网控制报文协议(ICMP)。IP协议是网际互联层最重要的协议,它提供的是一个不可靠、无连接的数据报传递服务。
3)传输层:传输层对应于OSI参考模型的传输层,为应用层实体提供端到端的通信功能。该层定义了两个主要的协议:传输控制协议(TCP)和用户数据报协议(UDP)。TCP协议提供的是一种可靠的、面向连接的数据传输服务;而UDP协议供的是不可靠的、无连接的数据传输服务。
4)应用层:应用层对应于OSI参考模型的会话层、表示层和应用层,为用户提供所需要的各种服务,例如FTP、Telnet、DNS、SMTP等。
我们以应用层FTP服务为例,说明两台主机通过TCP/IP协议的通信过程。除物理层是实际传输数据的,其他对等层只是虚拟通信(所以画的是虚线),对等层一般需要遵照相同的协议。上层传输数据只与相邻上下层有关系。TCP及以下层是由操作系统内核实现,是处理通信细节,而应用层程序是通过socket编程实现的,处理的是应用程序细节。
2. socket在网络编程中的作用
通过前面的分析,我们知道应用层程序在进行网络通讯时,不需要关心传输层及以下层的实现细节,我们只需要通过抽象的 socket 接口进行功能编写通讯逻辑,如下图所示:
socket 描述IP地址和端口,是一个通信链的句柄,用来实现不同计算机间的通信。由于 socket起源于UNIX,在Unix一切皆文件哲学的思想下,socket是一种"打开—读/写—关闭"模式的实现,服务器和客户端各自维护一个"文件",在建立连接打开后,可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。需要说明的是,对于一个网络连接来说,套接字是平等的,并没有差别,不因为在服务器端或在客户端而产生不同级别。
那么应用程序如何使用 socket 进行通信的呢,如下图所示:
所以对于一个服务器端应用程序,它首先创建一个 socket,绑定并监听某个端口,然后通过调用 accpet 接口等待来自客户端的连接。此时客户端程序通过创建的 socket,发起 connect 到该服务器的端口上请求,如果连接成功,双方则建立了一个可靠的通信通道。这时客户端和服务器端都可以通过 send 发送内容到对方,对方则通过调用 recv 接口接收这些数据。完成通信过程后,则只需要调用各自的 close 接口关闭该 socket,释放该端口资源。
3. 用Python实现简单的client和server网络程序
上一节对应用程序使用 socket 进行网络通讯的过程进行了说明,下面就开始正式用 Python 编写我们的客户端和服务器端程序(该代码来自《Python核心编程(第二版)》的第16章),它实现的功能是客户端发送字符串到服务器端后,会返回一个带时间戳的字符串给客户端。
服务器端 server.py
#coding:utf-8
import socket
from time import ctime
HOST = ''
PORT = 21567
BUFSIZE = 1024
ADDR = ('127.0.0.1', PORT)
# 服务器端创建 socket
serverSock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
serverSock.bind(ADDR)
serverSock.listen(5)
while True:
server2client_Sock, addr = serverSock.accept()
while True:
data = server2client_Sock.recv(BUFSIZE)
# 如果数据接收完,则退出 recv, 进入到下一个连接
if not data:
break
server2client_Sock.send('[%s] %s' % (ctime(), data))
server2client_Sock.close()
serverSock.close()
客户端 client.py
#coding:utf-8
import socket
from time import ctime
HOST = ''
PORT = 21567
BUFSIZE = 1024
ADDR = (HOST, PORT)
# 客户端创建 socket
clientSock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
clientSock.connect(ADDR)
while True:
data = raw_input("> ")
if not data:
break
clientSock.send(data)
recData = clientSock.recv(BUFSIZE)
if not recData:
break
print recData
clientSock.close()
对照上面 socket 通信过程的图,很容易看懂代码的意思,所以这里主要看一下server.py 中 while 循环部分的逻辑。执行 python server.py,进入到 第一个while 循环后,调用 accept 函数会使得服务器端进入阻塞等待模式,等待客户端的连接。这时如果客户端有连接到达时,该函数会返回,于是进入到第二个 while 循环内部,该循环主要用来处理这一次的连接,在该连接保持阶段客户端和服务器可以进行多次通讯。
那么连接什么时候结束呢?在本次示例中,当客户端发送的内容为空时,则服务器端会退出连接部分的 while 循环,关闭本次连接的 socket,于是退回到主循环进入等待下一个客户端的连接。至此,一个简单的client-server 模式的Python 程序即完成。
4. 问题分析
细心的读者可以发现,这样的 server.py 服务器一次只能处理一个客户端的连接,我们可以在打开 server.py 时,同时启动两个客户端进程,我们发现只有在第一个客户端结束后,才会开始处理第二个客户端的连接请求。像这样一次只能处理一个连接的服务器肯定是没有实际用途的,那如何能够做一次处理多个连接,最重要的是怎么让同时处理多个连接更高效,进而可以支撑起非常高的并发呢?下面一章我们将讨论解决这个问题的方法,以及tornado是如何做的。