最近正好学习了一点用java socket编程的东西。感觉整体的流程虽然不是很繁琐,但是也值得好好总结一下。
Socket
Socket可以说是一种针对网络的抽象,应用通过它可以来针对网络读写数据。就像通过一个文件的file handler就可以都写数据到存储设备上一样。根据TCP协议和UDP协议的不同,在网络编程方面就有面向两个协议的不同socket,一个是面向字节流的一个是面向报文的。
对socket的本身组成倒是比较好理解。既然是应用通过socket通信,肯定就有一个服务器端和一个客户端。所以它必然就包含有一个对应的IP地址。另外,在这个地址上server要提供一系列的服务,于是就需要有一系列对应的窗口来提供服务。所以就有一个对应的端口号(Port)。端口号是一个16位的二进制数字,那么范围就是从(0-65535)。IP地址加端口号基本上就构成了socket。下面这幅图可以描绘出socket和整个TCP/IP之间的关系:
TCP
TCP主要是面向连接的协议,它包含有建立和拆除连接,保证数据流的顺序和正确性等功能。每次对TCP中间的数据操作相当于对一个数据流进行访问。它最典型的特征就是那三次握手的建立连接过程。TCP的连接建立和撤销过程如下图:
Server端
Server端所要做的事情主要是建立一个通信的端点,然后等待客户端发送的请求。典型的处理步骤如下:
1. 构建一个ServerSocket实例,指定本地的端口。这个socket就是用来监听指定端口的连接请求的。
2.重复如下几个步骤:
a. 调用socket的accept()方法来获得下面客户端的连接请求。通过accept()方法返回的socket实例,建立了一个和客户端的新连接。
b.通过这个返回的socket实例获取InputStream和OutputStream,可以通过这两个stream来分别读和写数据。
c.结束的时候调用socket实例的close()方法关闭socket连接。
这个流程的典型示例代码如下:
//1. 构造ServerSocket实例,指定服务端口。
ServerSocket servSock =newServerSocket(servPort);
while(true)
{
// 2.调用accept方法,建立和客户端的连接
Socket clntSock = servSock.accept();
SocketAddress clientAddress =
clntSock.getRemoteSocketAddress();
System.out.println("Handling client at "+ clientAddress);
// 3. 获取连接的InputStream,OutputStream来进行数据读写
InputStream in = clntSock.getInputStream();
OutputStream out = clntSock.getOutputStream();
while((recvMsgSize = in.read(receiveBuf)) != -1)
{
out.write(receiveBuf,0, recvMsgSize);
}
// 4.操作结束,关闭socket.
clntSock.close();
}
Client端
客户端的请求过程稍微有点不一样:
1.构建Socket实例,通过指定的远程服务器地址和端口来建立连接。
2.通过Socket实例包含的InputStream和OutputStream来进行数据的读写。
3.操作结束后调用socket实例的close方法,关闭。
示例代码如下;
// 1.根据指定的server地址和端口,建立socket连接。
Socket socket =newSocket(server, servPort);
// 2. 根据socket实例获取InputStream, OutputStream进行数据读写。
InputStream in = socket.getInputStream();
OutputStream out = socket.getOutputStream();
out.write(data);
//3.操作结束,关闭socket.
socket.close();
UDP
UDP和TCP有两个典型的区别,一个就是它不需要建立连接,另外就是它在每次收发的报文都保留了消息的边界。
server端
因为UDP协议不需要建立连接,它的过程如下:
1. 构造DatagramSocket实例,指定本地端口。
2. 通过DatagramSocket实例的receive方法接收DatagramPacket.DatagramPacket中间就包含了通信的内容。
3. 通过DatagramSocket的send和receive方法来收和发DatagramPacket.
典型的交互流程代码如下:
// 1. 构建DatagramSocket实例,指定本地端口。
DatagramSocket socket =newDatagramSocket(servPort);
// 2. 构建需要收发的DatagramPacket报文
DatagramPacket packet =newDatagramPacket(newbyte[ECHOMAX], ECHOMAX);
while(true)
{
// 3. 收报文
socket.receive(packet);
System.out.println("Handling client at "+ packet.getAddress().getHostAddress()
+" on port "+ packet.getPort());
// 4. 发报文
socket.send(packet);
packet.setLength(ECHOMAX);
}
client端
UDP客户端的步骤也比较简单,主要包括下面3步:
1. 构造DatagramSocket实例。
2.通过DatagramSocket实例的send和receive方法发送DatagramPacket报文。
3.结束后,调用DatagramSocket的close方法关闭。
因为和TCP不同,UDP发送报文的时候可以在同一个本地端口随意发送给不同的服务器,一般不需要在UDP的DatagramSocket的构造函数中指定目的服务器的地址。
另外,UDP客户端还有一个重要的不同就是,TCP客户端发送echo连接消息之后会在调用read方法的时候进入阻塞状态,而UDP这样却不行。因为UDP中间是可以允许报文丢失的。如果报文丢失了,进程一直在阻塞或者挂起的状态,则进程会永远没法往下走了。所以会一般设置一个setSoTimeout方法,指定在多久的时间内没有收到报文就放弃。也可以通过指定一个数字,循环指定的次数来读取报文,读到就返回,否则就放弃。
一个典型的UDP Client代码示例如下:
// 1. 构造UDP DatagramSocket对象
DatagramSocket socket =newDatagramSocket();
// 2。指定timeout时间,防止进入无限等待状态
socket.setSoTimeout(TIMEOUT);
// 3. 构造收发的报文对象
DatagramPacket sendPacket =newDatagramPacket(bytesToSend,
bytesToSend.length, serverAddress, servPort);
DatagramPacket receivePacket =
newDatagramPacket(newbyte[bytesToSend.length], bytesToSend.length);
// 4.指定尝试的次数
inttries =0;
booleanreceivedResponse =false;
do
{
socket.send(sendPacket);
try
{
socket.receive(receivePacket);
if(!receivePacket.getAddress().equals(serverAddress))
{
thrownewIOException("Received packet from an unknown source");
}
receivedResponse =true;
}
catch(InterruptedIOException e)
{
tries +=1;
System.out.println("Timed out, "+ (MAXTRIES - tries) +"");
}
}while((!receivedResponse) && (tries < MAXTRIES));
// 根据是否接收到报文进行反馈
if(receivedResponse)
{
System.out.println("Received: "+newString(receivePacket.getData()));
}
else
{
System.out.println("No response -- giving up.");
}
// 5. 关闭socket
socket.close();
总结
TCP的server和client之间通信就好比两个人打电话,需要互相知道对方的电话号码,然后开始对话。所以在两者的连接过程中间需要指定端口和地址。
UDP的server和client之间的通信就像两个人互相发信。我只需要知道对方的地址,然后就发信过去。对方是否收到我不知道,也不需要专门对口令似的来建立连接。
这些示例其实只是一个最简单的,单线程,也只能一次处理单个请求的情况。在实际应用中一般会应用到多线程和一些处理高并发的策略,比如基于事件驱动的reactor模式等。可以在后续的文章中深入讨论。