1. Java NIO概述
Java NIO 由以下几个核心部分组成:
Channels
Buffers
Selectors
虽然Java NIO 中除此之外还有很多类和组件,但在我看来,Channel
,Buffer
和 Selector
构成了核心的API。其它组件,如Pipe
和FileLock
,只不过是与三个核心组件共同使用的工具类。因此,在概述中我将集中在这三个组件上。其它组件会在单独的章节中讲到。
Channel 和 Buffer
基本上,所有的 IO 在NIO 中都从一个Channel
开始。Channel
有点象流。 数据可以从Channel
读到Buffer
中,也可以从Buffer
写到Channel
中。这里有个图示:
Channel
和Buffer
有好几种类型。
下面是Java NIO中的一些主要Channel
的实现:
FileChannel
DatagramChannel
SocketChannel
ServerSocketChannel
这些通道涵盖了UDP 和 TCP 网络IO,以及文件IO
以下是Java NIO里关键的Buffer实现:
ByteBuffer
CharBuffer
DoubleBuffer
FloatBuffer
IntBuffer
LongBuffer
ShortBuffer
这些Buffer
覆盖了能通过IO发送的基本数据类型:byte
, short
, int
, long
, float
,double
和 char
。
Java NIO 还有个 MappedByteBuffe
r,用于表示内存映射文件, 我不打算在概述中说明。
Selector
Selector
允许单线程处理多个 Channel
。如果你的应用打开了多个连接(通道),但每个连接的流量都很低,使用Selector
就会很方便。例如,在一个聊天服务器中。
这是在一个单线程中使用一个Selector
处理3个Channel
的图示:
要使用Selector
,得向Selector
注册Channel
,然后调用它的select()
方法。这个方法会一直阻塞到某个注册的通道有事件就绪。一旦这个方法返回,线程就可以处理这些事件,事件的例子有如新连接进来,数据接收等。
2. Channel
Java NIO的通道类似流,但又有些不同:
- 既可以从通道中读取数据,又可以写数据到通道。但流的读写通常是单向的。
- 通道可以异步地读写。
- 通道中的数据总是要先读到一个
Buffer
,或者总是要从一个Buffer
中写入。
Channel的实现
这些是Java NIO中最重要的通道的实现:
-
FileChannel
:从文件中读写数据 -
DatagramChannel
:能通过UDP读写网络中的数据 -
SocketChannel
:能通过TCP读写网络中的数据 -
ServerSocketChannel
:可以监听新进来的TCP连接,像Web服务器那样。对每一个新进来的连接都会创建一个SocketChannel
基本的Channel示例
下面是一个使用FileChannel
读取数据到Buffer
中的示例:
RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
FileChannel inChannel = aFile.getChannel();
ByteBuffer buf = ByteBuffer.allocate(48);
int bytesRead = inChannel.read(buf);
while(bytesRead != -1){
System.out.println("Read " + bytesRead);
buf.flip();
while(buf.hasRemaining()){
System.out.print((char)buf.get());
}
buf.clear();
bytesRead = inChannel.read(buf);
}
aFile.close();
注意 buf.flip()
的调用,首先读取数据到Buffer
,然后反转Buffer
,接着再从Buffer
中读取数据。下一节会深入讲解Buffer的更多细节。
3. Buffer
Java NIO中的Buffer用于和NIO通道进行交互。数据是从通道读入缓冲区,从缓冲区写入到通道中的。
缓冲区本质上是一块可以写入数据,然后可以从中读取数据的内存。这块内存被包装成NIO Buffer对象,并提供了一组方法,用来方便的访问该块内存。
Buffer 的基本用法
使用Buffer
读写数据一般遵循一下四个步骤:
- 写入数据到
Buffer
- 调用
flip()
方法 - 从
Buffer
中读取数据 - 调用
clear()
方法或者compact()
方法
当向Buffer
写入数据时,Buffer
会记录下写了多少数据。一旦要读取数据,需要通过flip()
方法将Buffer
从写模式切换到读模式。在读模式下,可以读取之前写入到Buffer
的所有数据。
一旦读完了所有的数据,就需要清空缓冲区,让它可以再次被写入。有两种方式能清空缓冲区:调用clear()
或compact()
方法。clear()
方法会清空整个缓冲区。compact()
方法只会清除已经读过的数据。任何未读的数据都被移到缓冲区的起始处,新写入的数据将放到缓冲区未读数据的后面。
下面是一个使用Buffer
的例子:
RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
FileChannel inChannel = aFile.getChannel();
//create buffer with capacity of 48 bytes
ByteBuffer buf = ByteBuffer.allocate(48);
int bytesRead = inChannel.read(buf);
while(bytesRead != -1){
buf.flip();//make buffer ready for read
while(buf.hasRemaining()){
System.out.print((char)buf.get());//read 1 byte at a time
}
buf.clear();//make buffer ready for writing
bytesRead = inChannel.read(buf);
}
aFile.close();
Buffer的capacity
,position
和limit
缓冲区本质上是一块可以写入数据,然后可以从中读取数据的内存。这块内存被包装成NIO Buffer对象,并提供了一组方法,用来方便的访问该块内存。
为了理解Buffer的工作原理,需要熟悉它的三个属性:
capacity
position
limit
position
和limit
的含义取决于Buffer处在读模式还是写模式。不管Buffer处在什么模式,capacity
的含义总是一样的。
这里有一个关于capacity
,position
和limit
在读写模式中的说明,详细的解释在插图后面。
capacity:
作为一个内存块,Buffer有一个固定的大小值,也叫capacity
.你只能往里写capacity
个byte
、long
,char
等类型。一旦Buffer满了,需要将其清空(通过读数据或者清除数据)才能继续写数据往里写数据。
position:
当你写数据到Buffer中时,position
表示当前的位置。初始的position
值为0。当一个byte
、long
等数据写到Buffer后, position
会向前移动到下一个可插入数据的Buffer单元。position
最大可为capacity – 1
。
limit:
在写模式下,Buffer的limit
表示你最多能往Buffer里写多少数据。 写模式下,limit
等于Buffer的capacity
。
当切换Buffer到读模式时,limit
表示你最多能读到多少数据。因此,当切换Buffer到读模式时,limit
会被设置成写模式下的position
值。换句话说,你能读到之前写入的所有数据(limit
被设置成已写数据的数量,这个值在写模式下就是position
)
Buffer的类型
Java NIO有一下Buffer类型
ByteBuffer
MappedByteBuffer
CharBuffer
DoubleBuffer
FloatBuffer
IntBuffer
LongBuffer
ShortBuffer
这些Buffer类型代表了不同的数据类型。换句话说,就是可以通过char
,short
,int
,long
,float
或 double
类型来操作缓冲区中的字节。
MappedByteBuffer
有些特别,在涉及它的专门章节中再讲。
Buffer
的分配
要想获得一个Buffer对象首先要进行分配。 每一个Buffer类都有一个allocate方法。下面是一个分配48字节capacity
的ByteBuffer
的例子。
ByteBuffer buf = ByteBuffer.allocate(48);
这是一个可存储1024个字符的CharBuffer
:
CharBuffer buf = CharBuffer.allocate(1024);
向Buffer中写数据
写数据到Buffer有两种方式:
- 从
Channel
写到Buffer
。 - 通过
Buffer
的put()
方法写到Buffer
里。
从Channel
写到Buffer
的例子:
int bytesRead = inChannel.read(buf);//read into buffer
通过put
方法写Buffer
的例子:
buf.put(127);
put
方法有很多版本,允许你以不同的方式把数据写入到Buffer
中。例如, 写到一个指定的位置,或者把一个字节数组写入到Buffer
。 更多Buffer
实现的细节参考JavaDoc。
flip()
方法
flip
方法将Buffer
从写模式切换到读模式。调用flip()
方法会将position
设回0,并将limit
设置成之前position
的值。
换句话说,position
现在用于标记读的位置,limit
表示之前写进了多少个byte
、char
等 —— 现在能读取多少个byte
、char
等。
从Buffer中读取数据
从Buffer中读取数据有两种方式:
- 从
Buffer
读取数据到Channel
。 - 使用
get()
方法从Buffer
中读取数据。
从Buffer
读取数据到Channel
的例子:
//read from buffer into channel
int bytesWritten = inChannel.write(buf);
使用get()
方法从Buffer
中读取数据的例子:
byte aByte = buf.get();
get
方法有很多版本,允许你以不同的方式从Buffer
中读取数据。例如,从指定position
读取,或者从Buffer
中读取数据到字节数组。更多Buffer
实现的细节参考JavaDoc。
rewind()
方法
Buffer.rewind()
将position
设回0,所以你可以重读Buffer
中的所有数据。limit
保持不变,仍然表示能从Buffer
中读取多少个元素(byte
、char
等)。
clear()
与compact()
方法
一旦读完Buffer中的数据,需要让Buffer准备好再次被写入。可以通过clear()
或compact()
方法来完成。
如果调用的是clear()
方法,position
将被设回0,limi
t被设置成capacity
的值。换句话说,Buffer 被清空了。Buffer中的数据并未清除,只是这些标记告诉我们可以从哪里开始往Buffer里写数据。
如果Buffer中有一些未读的数据,调用clear()
方法,数据将“被遗忘”,意味着不再有任何标记会告诉你哪些数据被读过,哪些还没有。
如果Buffer中仍有未读的数据,且后续还需要这些数据,但是此时想要先先写些数据,那么使用compact()
方法。
compact()
方法将所有未读的数据拷贝到Buffer起始处。然后将position
设到最后一个未读元素正后面。limi
t属性依然像clear()
方法一样,设置成capacity
。现在Buffer准备好写数据了,但是不会覆盖未读的数据。
mark()
和reset()
方法
通过调用Buffer.mark()
方法,可以标记Buffer
中的一个特定position
。之后通过调用Buffer.reset()
方法恢复到这个position
。例如:
buffer.mark();
//call buffer.get() a couple of times, e.g. during parsing.
buffer.reset();
//set position back to mark
equals()
和compareTo()
方法
可以使用equals()
和compareTo()
方法比较两个Buffer。
equals()
当满足下列条件时,表示两个Buffer相等:
- 有相同的类型(
byte
、char
、int
等)。 -
Buffer
中剩余的byte
、char
等的个数相等。 -
Buffer
中所有剩余的byte
、cha
等都相同。
compareTo()
方法
compareTo()
方法比较两个Buffer
的剩余元素(byte
、char
等), 如果满足下列条件,则认为一个Buffer
“小于”另一个Buffer
:
- 第一个不相等的元素小于另一个Buffer中对应的元素 。
- 所有元素都相等,但第一个Buffer比另一个先耗尽(第一个Buffer的元素个数比另一个少)。
(注:剩余元素是从 position到limit之间的元素)
4. Scatter/Gather
Java NIO开始支持scatter/gather,scatter/gather用于描述从Channel(译者注:Channel在中文经常翻译为通道)中读取或者写入到Channel的操作。
分散(scatter
)从Channel
中读取是指在读操作时将读取的数据写入多个buffer
中。因此,Channel
将从Channel
中读取的数据“分散(scatter
)”到多个Buffer
中。
聚集(gather
)写入Channel
是指在写操作时将多个buffer
的数据写入同一个Channel
,因此,Channel
将多个Buffer
中的数据“聚集(gather
)”后发送到Channel
。
scatter / gather经常用于需要将传输的数据分开处理的场合,例如传输一个由消息头和消息体组成的消息,你可能会将消息体和消息头分散到不同的buffer中,这样你可以方便的处理消息头和消息体。
Scattering Reads
Scattering Reads是指数据从一个channel读取到多个buffer中。如下图描述:
示例代码如下:
ByteBuffer header = ByteBuffer.allocate(128);
ByteBuffer body = ByteBuffer.allocate(1024);
ByteBuffer[] bufferArray = {header, body};
channel.read(bufferArray);
注意buffer首先被插入到数组,然后再将数组作为channel.read()
的输入参数。read()
方法按照buffer在数组中的顺序将从channel中读取的数据写入到buffer,当一个buffer被写满后,channel
紧接着向另一个buffer中写。
Scattering Reads在移动下一个buffer前,必须填满当前的buffer,这也意味着它不适用于动态消息(译者注:消息大小不固定)。换句话说,如果存在消息头和消息体,消息头必须完成填充(例如 128byte),Scattering Reads才能正常工作。
Gathering Writes
示例代码如下:
ByteBuffer header = ByteBuffer.allocate(128);
ByteBuffer body = ByteBuffer.allocate(1024);
//write data into buffers
ByteBuffer[] bufferArray = {header, body};
channel.write(bufferArray);
bufferArray数组是write()
方法的入参,write()
方法会按照buffer在数组中的顺序,将数据写入到channel,注意只有position和limit之间的数据才会被写入。因此,如果一个buffer的容量为128byte,但是仅仅包含58byte的数据,那么这58byte的数据将被写入到channel中。因此与Scattering Reads相反,Gathering Writes能较好的处理动态消息。
5. 通道之间的数据传输
在Java NIO中,如果两个通道中有一个是FileChannel,那你可以直接将数据从一个channel传输到另外一个channel。
transferFrom()
FileChannel
的transferFrom()
方法可以将数据从源通道传输到FileChannel
中。
下面是一个简单的例子:
RandomAccessFile fromFile = new RandomAccessFile("fromFile.txt", "rw");
FileChannel fromChannel = fromFile.getChannel();
RandomAccessFile toFile = new RandomAccessFile("toFile.txt", "rw");
FileChannel toChannel = toFile.getChannel();
long position = 0;
long count = fromChannel.size();
toChannel.transferFrom(position, count, fromChannel);
方法的输入参数position
表示从position
处开始向目标文件写入数据,count
表示最多传输的字节数。如果源通道的剩余空间小于 count
个字节,则所传输的字节数要小于请求的字节数。
此外要注意,在SoketChannel
的实现中,SocketChannel
只会传输此刻准备好的数据(可能不足count
字节)。因此,SocketChannel
可能不会将请求的所有数据(count
个字节)全部传输到FileChannel
中。
transferTo()
transferTo()
方法将数据从FileChannel
传输到其他的channel
中。下面是一个简单的例子:
RandomAccessFile fromFile = new RandomAccessFile("fromFile.txt", "rw");
FileChannel fromChannel = fromFile.getChannel();
RandomAccessFile toFile = new RandomAccessFile("toFile.txt", "rw");
FileChannel toChannel = toFile.getChannel();
long position = 0;
long count = fromChannel.size();
fromChannel.transferTo(position,count,toChannel);
这个例子和前面那个例子特别相似,除了调用方法的FileChannel对象不一样外,其他的都一样。
上面所说的关于SocketChannel的问题在transferTo()
方法中同样存在。SocketChannel会一直传输数据直到目标buffer被填满。
6. Selector
Selector(选择器)是 Java NIO中能够检测一个到多个NIO通道,并能够知晓通道是否为诸如读写事件做好准备的组件。这样,一个单独的线程可以管理多个channel
,从而管理多个网络连接。
6.1.为什么使用Selector?
仅用单个线程来处理多个Channels的好处是,只需要更少的线程来处理通道。事实上,可以只用一个线程处理所有的通道。对于操作系统来说,线程之间上下文切换的开销很大,而且每个线程都要占用系统的一些资源(如内存)。因此,使用的线程越少越好。
但是,需要记住,现代的操作系统和CPU在多任务方面表现的越来越好,所以多线程的开销随着时间的推移,变得越来越小了。实际上,如果一个CPU有多个内核,不使用多任务可能是在浪费CPU能力。不管怎么说,关于那种设计的讨论应该放在另一篇不同的文章中。在这里,只要知道使用Selector能够处理多个通道就足够了。
下面是单线程使用一个Selector处理3个channel的示例图:
6.2. Selector的创建
通过调用Selector.open()
方法创建一个Selector
,如下:
Selector selector = Selector.open();
6.3. 向Selector注册通道
为了将Channel
和Selector
配合使用,必须将channel
注册到selector
上。通过SelectableChannel.register()
方法来实现,如下:
channel.configureBlocking(false);
SelectionKey key = channel.register(selector, SelectionKey.OP_READ);
与Selector
一起使用时,Channel
必须处于非阻塞模式下。这意味着不能将FileChannel
与Selector
一起使用,因为FileChannel
不能切换到非阻塞模式。而套接字通道都可以。
注意register()
方法的第二个参数。这是一个“interest集合”,意思是在通过Selector监听Channel时对什么事件感兴趣。可以监听四种不同类型的事件:
Connect
Accept
Read
Write
通道触发了一个事件意思是该事件已经就绪。所以,某个channel
成功连接到另一个服务器称为“连接就绪”。一个server socket channel 准备好接收新进入的连接称为“接受就绪”。一个有数据可读的通道可以说是“读就绪”,等待写数据的通道可以说是“写就绪”。
这四种事件用SelectionKey
的四个常量来表示:
SelectionKey.OP_CONNECT
SelectionKey.OP_ACCEPT
SelectionKey.OP_READ
SelectionKey.OP_WRITE
如果对不止一种事件感兴趣,那么可以用“位或”操作符将常量连接起来,如下:
int interestSet = SelectionKey.OP_READ | SelectionKey.OP_WRITE;
在下面还会继续提到interest集合。
6.4. SelectionKey
在上一小节中,当向Selector注册Channel时,register()
方法会返回一个SelectionKey
对象。这个对象包含了一些你感兴趣的属性:
-
interest
集合 -
ready
集合 Channel
Selector
- 附加的对象(可选)
interest集合
就像向Selector注册通道一节中所描述的,interest集合是你所选择的感兴趣的事件集合。可以通过SelectionKey
读写interest集合,像这样:
int interestSet = selectionKey.interestOps();
boolean isInterestedInAccept = (interestSet & SelectionKey.OP_ACCEPT) == SelectionKey.OP_ACCEPT;
boolean isInterestedInConnect = interestSet & SelectionKey.OP_CONNECT;
boolean isInterestedInRead = interestSet & SelectionKey.OP_READ;
boolean isInterestedInWrite = interestSet & SelectionKey.OP_WRITE;
可以看到,用“位与”操作interest 集合和给定的SelectionKey常量,可以确定某个确定的事件是否在interest 集合中。
ready集合
ready
集合是通道以及准备就绪的操作的集合。在一次选择(Selection)之后,你会首先访问这个ready set。Selection将在下一小节进行解释。可以这样访问ready集合:
int readySet = selectionKey.readyOps();
可以用像检测interest集合那样的方法,来检测channel中什么事件或操作已经就绪。但是,也可以使用以下四个方法,它们都会返回一个布尔类型:
selectionKey.isAcceptable();
selectionKey.isConnectable();
selectionKey.isReadable();
selectionKey.isWritable();
Channel + Selector
从SelectionKey访问Channel和Selector很简单。如下:
Channel channel = selectionKey.channel();
Selector selector = selectionKey.selector();
附加对象
可以将一个对象或者更多信息附着到SelectionKey上,这样就能方便的识别某个给定的通道。例如,可以附加与通道一起使用的Buffer,或是包含聚集数据的某个对象。使用方法如下:
selectionKey.attach(theObject);
Object attachedObj = selectionKey.attachment();
还可以在用register()
方法向Selector注册Channel的时候附加对象。如:
SelectionKey key = channel.register(selector, SelectionKey.OP_READ, thObject);
6.5. 通过Selector选择通道
一旦向Selector注册了一或多个通道,就可以调用几个重载的select()
方法。这些方法返回你所感兴趣的事件(如连接、接受、读或写)已经准备就绪的那些通道。换句话说,如果你对“读就绪”的通道感兴趣,select()
方法会返回读事件已经就绪的那些通道。
下面是select()
方法:
int select()
int select(long timeout)
int selectNow()
select()
阻塞到至少有一个通道在你注册的事件上就绪了。
select(long timeout)
和select()
一样,除了最长会阻塞timeout
毫秒(参数)。
selectNow()
不会阻塞,不管什么通道就绪就立刻返回(此方法执行非阻塞的选择操作。如果自从前一次选择操作后,没有通道变成可选择的,则此方法直接返回零。)
select()
方法返回的int值表示有多少通道已经就绪。亦即,自上次调用select()
方法后有多少通道变成就绪状态。如果调用select()
方法,因为有一个通道变成就绪状态,返回了1,若再次调用select()
方法,如果另一个通道就绪了,它会再次返回1。如果对第一个就绪的channel
没有做任何操作,现在就有两个就绪的通道,但在每次select()
方法调用之间,只有一个通道就绪了。
6.6.selectedKeys()
一旦调用了select()
方法,并且返回值表明有一个或更多个通道就绪了,然后就可以通过调用selector
的selectedKeys()
方法,访问"已选择键集(selected key set)"中的就绪通道。如下所示:
Set selectedkeys = selector.selectedKeys();
当向Selector注册Channel时,Channel.register()
方法会返回一个SelectionKey
对象。这个对象代表了注册到该Selector
的通道。可以通过SelectionKey
的selectedKeySet()
方法访问这些对象。
可以遍历这个已选择的键集合来访问就绪的通道。如下:
Set selectedKeys = selector.selectedKeys();
Iterator keyIterator = selectedKeys.iterator();
while(keyIterator.hasNext()) {
SelectionKey key = keyIterator.next();
if(key.isAcceptable()) {
// a connection was accepted by a ServerSocketChannel.
} else if (key.isConnectable()) {
// a connection was established with a remote server.
} else if (key.isReadable()) {
// a channel is ready for reading
} else if (key.isWritable()) {
// a channel is ready for writing
}
keyIterator.remove();
}
这个循环遍历已选择键集中的每个键,并检测各个键所对应的通道的就绪事件。
注意每次迭代末尾的keyIterator.remove()
调用。Selector
不会自己从已选择键集中移除SelectionKey
实例。必须在处理完通道时自己移除。下次该通道变成就绪时,Selecto
r会再次将其放入已选择键集中。
SelectionKey.channel()
方法返回的通道需要转型成你要处理的类型,如ServerSocketChannel
或SocketChannel
等。
6.7. wakeUp()
某个线程调用select()
方法后阻塞了,即使没有通道已经就绪,也有办法让其从select()
方法返回。只要让其它线程在第一个线程调用select()
方法的那个对象上调用Selector.wakeup()
方法即可。阻塞在select()
方法上的线程会立马返回。
如果有其它线程调用了wakeup()
方法,但当前没有线程阻塞在select()
方法上,下个调用select()
方法的线程会立即“醒来(wake up)”。
6.8. Close()
用完Selector后调用其close()
方法会关闭该Selector,且使注册到该Selector上的所有SelectionKey实例无效。通道本身并不会关闭。
6.9. 完整的示例
这里有一个完整的示例,打开一个Selector,注册一个通道注册到这个Selector上(通道的初始化过程略去),然后持续监控这个Selector的四种事件(接受,连接,读,写)是否就绪。
Selector selector = Selector.open();
channel.configureBlocking(false);
SelectionKey key = channel.register(selector, SelectionKey.OP_READ);
while(true) {
int readyChannels = selector.select();
if(readyChannels == 0) continue;
Set selectedKeys = selector.selectedKeys();
Iterator keyIterator = selectedKeys.iterator();
while(keyIterator.hasNext()) {
SelectionKey key = keyIterator.next();
if(key.isAcceptable()) {
// a connection was accepted by a ServerSocketChannel.
} else if (key.isConnectable()) {
// a connection was established with a remote server.
} else if (key.isReadable()) {
// a channel is ready for reading
} else if (key.isWritable()) {
// a channel is ready for writing
}
keyIterator.remove();
}
}
7. FileChannel
Java NIO中的FileChannel是一个连接到文件的通道。可以通过文件通道读写文件。
FileChannel无法设置为非阻塞模式,它总是运行在阻塞模式下。
7.1 打开FileChannel
在使用FileChannel
之前,必须先打开它。但是,我们无法直接打开一个FileChannel
,需要通过使用一个InputStream
、OutputStream
或RandomAccessFile
来获取一个FileChannel
实例。下面是通过RandomAccessFile
打开FileChannel
的示例:
RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
FileChannel inChannel = aFile.getChannel();
7.2 从FileChannel读取数据
调用多个read()
方法之一从FileChannel
中读取数据。如:
ByteBuffer buf = ByteBuffer.allocate(48);
int bytesRead = inChannel.read(buf);
首先,分配一个Buffer。从FileChannel中读取的数据将被读到Buffer中。
然后,调用FileChannel.read()
方法。该方法将数据从FileChannel读取到Buffer中。read()
方法返回的int值表示了有多少字节被读到了Buffer中。如果返回-1,表示到了文件末尾。
7.3 向FileChannel写数据
使用FileChannel.write()
方法向FileChannel写数据,该方法的参数是一个Buffer。如:
String newData = "New String to write to file..." + System.currentTimeMillis();
ByteBuffer buf = ByteBuffer.allocate(48);
buf.clear();
buf.put(newData.getBytes());
buf.flip();
while(buf.hasRemaining()) {
channel.write(buf);
}
注意FileChannel.write()
是在while
循环中调用的。因为无法保证write()
方法一次能向FileChannel
写入多少字节,因此需要重复调用write()
方法,直到Buffer中已经没有尚未写入通道的字节。
7.4 关闭FileChannel
用完FileChannel后必须将其关闭。如:
channel.close();
7.5 FileChannel的position方法
有时可能需要在FileChannel的某个特定位置进行数据的读/写操作。可以通过调用position()
方法获取FileChannel的当前位置。
也可以通过调用position(long pos)
方法设置FileChannel的当前位置。
这里有两个例子:
long pos = channel.position();
channel.position(pos +123);
如果将位置设置在文件结束符之后,然后试图从文件通道中读取数据,读方法将返回-1 —— 文件结束标志。
如果将位置设置在文件结束符之后,然后向通道中写数据,文件将撑大到当前位置并写入数据。这可能导致“文件空洞”,磁盘上物理文件中写入的数据间有空隙。
7.6 FileChannel的size方法
FileChannel实例的size()
方法将返回该实例所关联的大小。如:
long fileSize = channel.size();
7.7 FileChannel的truncate方法
可以使用FileChannel.truncate()方法截取一个文件。截取文件时,文件将中指定长度后面的部分将被删除。如:
channel.truncate(1024);
这个例子截取文件的前1024个字节。
7.8 FileChannel的force方法
FileChannel.force()
方法将通道里尚未写入磁盘的数据强制写到磁盘上。出于性能方面的考虑,操作系统会将数据缓存在内存中,所以无法保证写入到FileChannel里的数据一定会即时写到磁盘上。要保证这一点,需要调用force()
方法。
force()
方法有一个boolean
类型的参数,指明是否同时将文件元数据(权限信息等)写到磁盘上。
下面的例子同时将文件数据和元数据强制写到磁盘上:
channel.force(true);
8. SocketChannel
Java NIO中的SocketChannel是一个连接到TCP网络套接字的通道,可以通过以下两种方式创建SocketChannel:
- 打开一个
SocketChannel
并连接到互联网上的某台服务器。 - 一个新连接到达
ServerSocketChannel
时,会创建一个SocketChannel
8.1 打开SocketChannel
下面是SocketChannel的打开方式:
SocketChannel socketChannel = SocketChannel.open();
socketChannel.connect(new InetSocketAdderss("http://baidu.com", 80));
8.2 关闭SocketChannel
当用完SocketChannel之后,调用socketChannel.close()
关闭SocketChannel:
socketChannel.close();
8.2 从SocketChannel读取数据
要从SocketChannel中读取数据,调用一个read()
的方法之一。以下是例子:
ByteBuffer buf = ByteBuffer.allocate(48);
int bytesRead = socketChannel.read(buf);
首先,分配一个Buffer。从SocketChannel读取到的数据将会放到这个Buffer中。
然后,调用SocketChannel.read()
。该方法将数据从SocketChannel 读到Buffer中。read()
方法返回的int值表示读了多少字节进Buffer里。如果返回的是-1,表示已经读到了流的末尾(连接关闭了)。
8.3 写入SocketChannel
写数据SocketChannel用的是SocketChannel.write()
方法,该方法以一个Buffer作为参数,示例如下:
String newData = "New String to write to file..." + System.currentTimeMillis();
ByteBuffer buf = ByteBuffer.allocate(48);
buf.clear();
buf.put(newData.getBytes());
buf.flip();
while(buf.hasRemaining()) {
channel.write(buf);
}
注意SocketChannel.write()
方法的调用是在一个while循环中的。write()
方法无法保证能写多少字节到SocketChannel。所以,我们重复调用write()
直到Buffer没有要写的字节为止。
8.4 非阻塞模式
可以设置SocketChannel为非阻塞模式(non-blocking mode)。设置之后,就可以在异步模式下调用connect()
, read()
和write()
了。
connect()
如果SocketChannel在非阻塞模式下,此时调用connect()
,该方法可能在连接建立之前就返回了。为了确定连接是否建立,可以调用finishConnect()
的方法,就像这样:
socketChannel.configureBlocking(false);
socketChannel.connect(new InetSocketAddress("http://baidu.com", 80));
while(! socketChannel.finishConnect() ){
//wait, or do something else...
}
write()
非阻塞模式下,write()方法在尚未写出任何内容时可能就返回了。所以需要在循环中调用write()。前面已经有例子了,这里就不赘述了。
read()
非阻塞模式下,read()方法在尚未读取到任何数据时可能就返回了。所以需要关注它的int返回值,它会告诉你读取了多少字节。
8.5 非阻塞模式与选择器
非阻塞模式与选择器搭配会工作的更好,通过将一或多个SocketChannel注册到Selector,可以询问选择器哪个通道已经准备好了读取,写入等。Selector与SocketChannel的搭配使用会在后面详讲。
9. ServerSocketChannel
Java NIO中的ServerSocketChannel是一个可以监听新进来的TCP连接的通道,就像标准IO中的ServerSocket一样。
ServerSocketChannel类在java.nio.channels
包中。
这里有个例子:
ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
serverSocketChannel.socket().bind(new InetSocketAddress(9999));
while(true){
SocketChannel socketChannel =
serverSocketChannel.accept();
//do something with socketChannel...
}
9.1 打开ServerSocketChannel
通过调用 ServerSocketChannel.open()
方法来打开ServerSocketChannel。如:
ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
9.2 关闭 ServerSocketChannel
通过调用ServerSocketChannel.close()
方法来关闭ServerSocketChannel。 如:
serverSocketChannel.close();
9.3 监听新进来的连接
通过 ServerSocketChannel.accept()
方法监听新进来的连接。当accept()
方法返回的时候,它返回一个包含新进来的连接的 SocketChannel。因此, accept()
方法会一直阻塞到有新连接到达。
通常不会仅仅只监听一个连接,在while
循环中调用accept()
方法. 如下面的例子:
while(true){
SocketChannel socketChannel =
serverSocketChannel.accept();
//do something with socketChannel...
}
当然,也可以在while循环中使用除了true以外的其它退出准则。
9.4非阻塞模式
ServerSocketChannel可以设置成非阻塞模式。在非阻塞模式下,accept()
方法会立刻返回,如果还没有新进来的连接,返回的将是null。 因此,需要检查返回的SocketChannel是否是null.如:
ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
serverSocketChannel.socket().bind(new InetSocketAddress(9999));
serverSocketChannel.configureBlocking(false);
while(true){
SocketChannel socketChannel =
serverSocketChannel.accept();
if(socketChannel != null){
//do something with socketChannel...
}
}
10. Java NIO DatagramChannel
Java NIO中的DatagramChannel是一个能收发UDP包的通道。因为UDP是无连接的网络协议,所以不能像其它通道那样读取和写入。它发送和接收的是数据包。
10.1 打开DatagramChannel
下面是 DatagramChannel 的打开方式:
DatagramChannel channel = DatagramChannel.open();
channel.socket().bind(new InetSocketAddress(9999));
10.2 接收数据
通过receive()
方法从DatagramChannel接收数据,如:
ByteBuffer buf = ByteBuffer.allocate(48);
buf.clear();
channel.receive(buf);
receive()
方法会将接收到的数据包内容复制到指定的Buffer. 如果Buffer容不下收到的数据,多出的数据将被丢弃。
10.3发送数据
通过send()
方法从DatagramChannel发送数据,如:
String newData = "New String to write to file..." + System.currentTimeMillis();
ByteBuffer buf = ByteBuffer.allocate(48);
buf.clear();
buf.put(newData.getBytes());
buf.flip();
int bytesSent = channel.send(buf, new InetSocketAddress("baidu.com", 80));
这个例子发送一串字符到”baidu.com”服务器的UDP端口80。 因为服务端并没有监控这个端口,所以什么也不会发生。也不会通知你发出的数据包是否已收到,因为UDP在数据传送方面没有任何保证。
10.4 连接到特定地址
可以将DatagramChannel“连接”到网络中的特定地址的。由于UDP是无连接的,连接到特定地址并不会像TCP通道那样创建一个真正的连接。而是锁住DatagramChannel ,让其只能从特定地址收发数据。
这里有个例子:
channel.connect(new InetSocketAddress("baidu.com", 80));
当连接后,也可以使用read()
和write()
方法,就像在用传统的通道一样。只是在数据传送方面没有任何保证。这里有几个例子:
int bytesRead = channel.read(buf);
int bytesWritten = channel.write(buf);
11. Pipe
Java NIO管道是两个线程之间的单向数据连接。Pipe有一个source通道和一个sink通道。数据会被写到sink通道,从source通道读取。这是Pipe原理的图示:
11.1创建管道
通过Pipe.open()
方法打开管道。例如
Pipe pipe = Pipe.open();
11.2 向管道写数据
要向管道写数据,需要访问sink通道。像这样:
Pipe.SinkChannel sinkChannel = pipe.sink();
通过调用SinkChannel的write()
方法,将数据写入SinkChannel
。像这样:
String newData = "New String to write to file..." + System.currentTimeMillis();
ByteBuffer buf = ByteBuffer.allocate(48);
buf.clear();
buf.put(newData.getBytes());
buf.flip();
while(buf.hasRemaining()) {
sinkChannel.write(buf);
}
11.3 从管道读取数据
从管道读取数据,需要访问source通道,像这样:
Pipe.SourceChannel sourceChannel = pipe.source();
调用source通道的read()
方法来读取数据,像这样:
ByteBuffer buf = ByteBuffer.allocate(48);
int bytesRead = sourceChannel.read(buf);
read()
方法返回的int值会告诉我们多少字节被读进了缓冲区。
12 Java NIO 与 IO
当学习了Java NIO和IO的API后,一个问题马上涌入脑海:
应该何时使用IO,何时使用NIO呢?
12.1 Java NIO 和 IO 的主要区别
下表总结了Java NIO和IO之间的主要区别:
IO | NIO |
---|---|
面向流 | 面向缓冲 |
阻塞IO | 非阻塞IO |
无 | 选择器 |
12.2 面向流与面向缓冲
Java NIO和IO之间第一个最大的区别是,IO是面向流的,NIO是面向缓冲区的。 Java IO面向流意味着每次从流中读一个或多个字节,直至读取所有字节,它们没有被缓存在任何地方。此外,它不能前后移动流中的数据。如果需要前后移动从流中读取的数据,需要先将它缓存到一个缓冲区。 Java NIO的缓冲导向方法略有不同。数据读取到一个它稍后处理的缓冲区,需要时可在缓冲区中前后移动。这就增加了处理过程中的灵活性。但是,还需要检查是否该缓冲区中包含所有需要处理的数据。而且,需确保当更多的数据读入缓冲区时,不要覆盖缓冲区里尚未处理的数据。
12.3 阻塞与非阻塞IO
Java IO的各种流是阻塞的。这意味着,当一个线程调用read() 或 write()时,该线程被阻塞,直到有一些数据被读取,或数据完全写入。该线程在此期间不能再干任何事情了。 Java NIO的非阻塞模式,使一个线程从某通道发送请求读取数据,但是它仅能得到目前可用的数据,如果目前没有数据可用时,就什么都不会获取。而不是保持线程阻塞,所以直至数据变的可以读取之前,该线程可以继续做其他的事情。 非阻塞写也是如此。一个线程请求写入一些数据到某通道,但不需要等待它完全写入,这个线程同时可以去做别的事情。 线程通常将非阻塞IO的空闲时间用于在其它通道上执行IO操作,所以一个单独的线程现在可以管理多个输入和输出通道(channel)。
12.4 选择器(Selectors)
Java NIO的选择器允许一个单独的线程来监视多个输入通道,可以注册多个通道使用一个选择器,然后使用一个单独的线程来“选择”通道:这些通道里已经有可以处理的输入,或者选择已准备写入的通道。这种选择机制,使得一个单独的线程很容易来管理多个通道。
12.5 NIO和IO如何影响应用程序的设计
无论选择IO或NIO工具箱,可能会影响应用程序设计的以下几个方面:
- 对NIO或IO类的API调用。
- 数据处理。
- 用来处理数据的线程数。
API调用
当然,使用NIO的API调用时看起来与使用IO时有所不同,但这并不意外,因为并不是仅从一个InputStream逐字节读取,而是数据必须先读入缓冲区再处理。
数据处理
使用纯粹的NIO设计相较IO设计,数据处理也受到影响。
在IO设计中,我们从InputStream或 Reader逐字节读取数据。假设你正在处理一基于行的文本数据流,例如:
Name: Anna
Age: 25
Email: anna@mailserver.com
Phone: 1234567890
该文本行的流可以这样处理:
InputStream input = … ; // get the InputStream from the client socket
BufferedReader reader = new BufferedReader(new InputStreamReader(input));
String nameLine = reader.readLine();
String ageLine = reader.readLine();
String emailLine = reader.readLine();
String phoneLine = reader.readLine();
请注意处理状态由程序执行多久决定。换句话说,一旦reader.readLine()方法返回,你就知道肯定文本行就已读完, readline()阻塞直到整行读完,这就是原因。你也知道此行包含名称;同样,第二个readline()调用返回的时候,你知道这行包含年龄等。 正如你可以看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是什么。一旦正在运行的线程已处理过读入的某些数据,该线程不会再回退数据(大多如此)。下图也说明了这条原则(Java IO: 从一个阻塞的流中读数据) :
而一个NIO的实现会有所不同,下面是一个简单的例子:
ByteBuffer buffer = ByteBuffer.allocate(48);
int bytesRead = inChannel.read(buffer);
注意第二行,从通道读取字节到ByteBuffer。当这个方法调用返回时,你不知道你所需的所有数据是否在缓冲区内。你所知道的是,该缓冲区包含一些字节,这使得处理有点困难。
假设第一次read(buffer)
调用后,读入缓冲区的数据只有半行,例如,“Name:An”,你能处理数据吗?显然不能,需要等待,直到整行数据读入缓存,在此之前,对数据的任何处理毫无意义。
所以,你怎么知道是否该缓冲区包含足够的数据可以处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在你知道所有数据都在缓冲区里之前,你必须检查几次缓冲区的数据。这不仅效率低下,而且可以使程序设计方案杂乱不堪。例如:
ByteBuffer buffer = ByteBuffer.allocate(48);
int bytesRead = inChannel.read(buffer);
while(! bufferFull(bytesRead) ) {
bytesRead = inChannel.read(buffer);
}
bufferFull()
方法必须跟踪有多少数据读入缓冲区,并返回真或假,这取决于缓冲区是否已满。换句话说,如果缓冲区准备好被处理,那么表示缓冲区满了
bufferFull()
方法扫描缓冲区,但必须保持在bufferFull()
方法被调用之前状态相同。如果没有,下一个读入缓冲区的数据可能无法读到正确的位置。这是不可能的,但却是需要注意的又一问题。
如果缓冲区已满,它可以被处理。如果它不满,并且在你的实际案例中有意义,你或许能处理其中的部分数据。但是许多情况下并非如此。下图展示了“缓冲区数据循环就绪”(Java NIO:从一个通道里读数据,直到所有的数据都读到缓冲区里.):
用来处理数据的线程数
NIO可让您只使用一个(或几个)单线程管理多个通道(网络连接或文件),但付出的代价是解析数据可能会比从一个阻塞流中读取数据更复杂。
如果需要管理同时打开的成千上万个连接,这些连接每次只是发送少量的数据,例如聊天服务器,实现NIO的服务器可能是一个优势。同样,如果你需要维持许多打开的连接到其他计算机上,如P2P网络中,使用一个单独的线程来管理你所有出站连接,可能是一个优势。一个线程多个连接的设计方案如下图所示(Java NIO: 单线程管理多个连接):
如果你有少量的连接使用非常高的带宽,一次发送大量的数据,也许典型的IO服务器实现可能非常契合。下图说明了一个典型的IO服务器设计(Java IO: 一个典型的IO服务器设计- 一个连接通过一个线程处理.):