Java里面,将IO流体系按操作方式分类,可分为字节流和字符流。相关类结构图如下:
字节流相关的基类是InputStream/OutputStream,其操作方式处理的最基本的数据单元是字节。字符流相关的基类是Reader和Writer,其操作方式处理的最基本的数据单元是Unicode编码的字符。
字节流
字节流通常用来二进制数据,所以适用的场景很多,比如网络数据传输,磁盘文件读写等等。
Java中最基本的两个字节流类是InputStream和OutputStream,它们分别代表了一组基本的输入字节流和输出字节流。InputStream类与OutputStream类均为抽象类,我们在实际使用中通常使用Java类库中提供的它们的一系列子类。我们以InputStream为例,介绍下Java的字节流。
InputStream类中定义了一个抽象方法read(),其子类通过实现该方法,处理从字节流读取字节的相关逻辑
public abstract int read() throws IOException;
read方法的功能是从字节流中读取一个字节,如果到了末尾则返回-1,否则就返回读取到的字节。调用这个方法需要注意的是,它会一直阻塞线程直到返回读取到的字节或者-1。另外,字节流默认情况下,是不支持缓存的。这意味着每次调用read()都会请求操作系统去读取一个字节,如果是文件读取,就会涉及到磁盘访问,因此效率会比较低。可能有人注意到InputStream类中还有另一个read(byte[])方法,其实它内部的实现也只是循环调用read()方法,本质上还是一样。基于这样的局限,就需要用到BufferedInputStream。它可以利用缓冲区来减少系统IO操作的次数,提高读写性能,缓冲区默认大小为8M。
以下是字节流的简单用法
File file = new File("H:/sourceCode/workspace4java/test.txt");
FileInputStream inputStream = new FileInputStream(file);
int n = -1;
byte[] bytes = new byte[(int)file.length()];
int len = inputStream.read(bytes);
System.out.println("文件字节长度为"+len);
System.out.println(new String(bytes));
inputStream.close();
FileInputStream inputStream2 = new FileInputStream(file);
BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream2,4*1024);
byte[] bytes2 = new byte[(int)file.length()];
int len2 = bufferedInputStream.read(bytes2);
System.out.println("文件字节长度为"+len2);
System.out.println(new String(bytes2));
inputStream2.close();
bufferedInputStream.close();
字符流
字符流通常用来处理文本数据。因为字符流操作的最基本的单元是Unicode码。Unicode码的范围是0x0000~0xFFFF,在这个范围内的每一个数字都与一个字符相对应,Java的String类型默认就是将字符以Unicode编码的形式存在内存中的。但在实际开发中,我们会发现,在某些系统或者存储文件中,字符并不都是以Unicode编码形式存储的。编码方式不同,会导致相同的字符会有不同的二进制表示。
所以实际上,字符流的工作机制是这样的:
- 输入流:将要读取的字节序列按指定的编码方式转换成相应的字符序列(实际上是Unicode码序列),然后存入内存。
- 输出流:将要传输的字符序列(实际上是Unicode码序列)按指定的编码方式转换成响应的字节流,然后输出。
由于字符流在输出前,都要完成字符序列到字节序列之间的转换过程,所以它会用到内存缓存区来存放转换得到的字节序列。
以下是字符流的简单用法:
File file = new File("H:/sourceCode/workspace4java/test.txt");
FileWriter writer = new FileWriter(file);
writer.write("这是一个输出字符流");
writer.close();
FileReader reader = new FileReader(file);
StringBuffer sb = new StringBuffer();
int temp2 = -1;
while((temp2 = reader.read())!=-1){
//read方法一次只读取一个字符
sb.append((char)temp2);
}
System.out.println(sb);
reader.close();
FileReader reader2 = new FileReader(file);
BufferedReader bufferedReader = new BufferedReader(reader2);
StringBuffer sb2 = new StringBuffer();
String str = null;
while((str = bufferedReader.readLine())!=null){
sb2.append(str);
}
System.out.println(sb2);
reader2.close();
bufferedReader.close();
FileWriter和BufferedWriter的区别
//例1
FileWriter file = new FileWriter("foo.txt");
file.write("foobar");
file.close();
FileWriter file = new FileWriter("foo.txt");BufferedWriter bf = new BufferedWriter(file);
bf.write("foobar");
bf.close();
//例2
for(int i = 0; i < 100; i++) {
writer.write("foorbar");
writer.write(NEW_LINE);}
writer.close();
- 写入单一数据(调用一次write方法)到文件时,FileWriter和BufferedWriter都是一次性写入到磁盘,也就是指有一次磁盘访问操作。而不是一个字符一个字符的写入。
- 写入多条数据(如代码中的例2),每一次执行write方法,FileWriter都会请求系统进行磁盘操作。而BufferedWriter则会根据其配置的缓存区大小,默认是8M,如果多次执行write方法累积的数据没有超过8M, 则只会调用一次磁盘操作写入。
字节流和字符流的区别
- 字节流操作的最基本的数据单元是字节,字符流操作的最基本的数据单元是字符。
- 字节流默认不使用缓冲区,字符输出流则会使用缓冲区存放转换的字节序列
- 字节流通常用于处理二进制数据,实际上可以处理任意类型的数据(图片,音视频,文本等),但它不支持直接读写Unicode码。字符流通常用来处理文本数据,它支持直接读写Unicode码。
随机访问文件
在实际开发中,文件的多线程下载和断点续传是经常会遇到的使用场景,这其中就涉及到从文件中的指定位置读写数据,这就需要用到Java中的RandomAccessFile类,随机访问文件。
一般的文件IO流,访问文件都是按照文件内容的顺序从头开始读写。RandomAccessFile类可以让我们从文件中的任何位置读写数据。
可以以4中模式创建RandomAccessFile对象:
模式 | 含义 |
---|---|
"r" | 文件以只读模式打开。 |
"rw" | 该文件以读写模式打开。 如果文件不存在,则创建该文件。 |
"rws" | 该文件以读写模式打开。 对文件的内容及其元数据的任何修改立即被写入存储设备。 |
"rwd" | 该文件以读写模式打开。 对文件内容的任何修改立即被写入存储设备。 |
//在构造方法中传入文件名称和访问模式
RandomAccessFile raf = new RandomAccessFile("randomtest.txt", "rw");
RandomAccessFile常用的一些方法
- 使用readUTF()和writeUTF()方法处理字符串。
- 使用readInt()和writeInt()方法处理整数。
- 通过getFilePointer()方法获取文件指针的位置,初始化时为0。
- 通过seek()方法,将文件指针设置到指定的位置。
- length() 返回文件当前的长度,我们也可以通过setLength()方法来扩展或者截断文件。
以下是RandomAccessFile类的简单用法
RandomAccessFile raf = new RandomAccessFile("H:/sourceCode/workspace4java/test.txt","rw");
raf.writeUTF("随机访问文件输出UTF-8");
raf.seek(0);
String str = raf.readUTF();
System.out.println(str);
raf.seek(8);
byte[] bytes = new byte[12];
raf.read(bytes);
String s = new String(bytes);
System.out.println(s);
raf.seek(0);
raf.writeUTF("访问文件RandomAccessFile");
raf.seek(0);
byte[] bytes2 = new byte[14];
raf.read(bytes2);
String s2 = new String(bytes2);
System.out.println(s2);
raf.seek(2);
byte[] bytes3 = new byte[12];
raf.read(bytes3);
String s3 = new String(bytes3);
System.out.println(s3);
raf.close();
打印结果
随机访问文件输出UTF-8
访问文件
访问文件
访问文件
值得注意的是,通过writeUTF方法写入数据,会默认在字符串开头多家两个字节。所以才会有上面的运行结果:从文件指针为0的位置,开始读取会读出开头的两个字节,而真实的数据内容从第三个字节的位置开始。
文章参考
https://stackoverflow.com/questions/21980090/javas-randomaccessfile-eofexception
https://www.ibm.com/developerworks/cn/java/j-lo-serial/index.html
http://www.importnew.com/23963.html
https://www.jianshu.com/p/509c78602ed2
https://stackoverflow.com/questions/12350248/java-difference-between-filewriter-and-bufferedwriter