这篇我们介绍java的文件操作。我相信大家电脑上都有很多的文件夹,每个文件夹里又有各种各样的文件。有用于系统配置的,有用于实现功能的,有用于工作学习娱乐的,或许还有用于不可描述行为的。每个文件都有自己的类型、大小、内容,如果权限足够,你一打开某个文件夹就可以手动创建/编辑/删除某些文件。其实,不光手动,我们用java程序也可以做到这些。
在java里负责文件操作的类叫作File,在文档它属于java.io包。我们之前讨论字符串操作时说过I/O这个词,它是输入和输出的意思。同样,文件操作也属于这个范畴。实例化一个文件的语句是
它接收一个字符串参数,就是某个文件的路径和名称。所以,对象引用f指的就是括号里的文件。比如我们现在用Eclipse新建一个叫FileOperations的项目–>包com.test –>Test.java,然后在项目内创建一个叫files的文件夹,里面放一个叫test.txt的空文件。结构和程序如下:
注意,文件的路径是由文件夹路径和文件名共同组成的,既可以用绝对路径,也可以用相对路径。java文档里文件对象的方法有很多,大多数都是很简洁明了的,比如取得文件名/文件路径,取得文件字节大小,删除文件等等。我们把几个常用的方法简单过一遍:
f.exists()返回的是一个布尔类型,判断文件是否存在,如果不存在就新建一个。它会抛出一个叫IOException的异常,关于异常的介绍着急的朋友可以先去看后面异常那篇,我们之后也会讨论到。Eclipse也会提示你添加异常,选择Add throws declaration直接在public static void main(String[] args)后边添上throws IOException:
这里有一点很重要,有些朋友错误地认为当File f = new File()实例化文件对象时文件必须已经存在,其实不一定,文件是文件,文件对象是文件对象,无论这个文件存不存在,内存都会开辟空间给这个新的对象,而且f会一直存储着它的地址。f.createNewFile()有可能抛异常,所以按照Eclipse的提示添加抛异常的语句。
除此之外,被实例化的还可以是一个文件夹,因为在java里文件夹算是一种特殊的文件。如果真是文件夹,你就可以打印出该文件夹下的所有文件:
用folder.isDirectory()判断文件路径指向的是不是一个文件夹,如果是文件夹那我就创建一个File类型的数组来存该文件夹下的所有文件,数组名是fileList。对这点看不懂的朋友请到数组那篇复习一下。folder.listFiles()恰好就返回该路径下所有的文件,我用一个for循环遍历整个数组将它们一一打印出来。
这就是文件的简单操作。我们刚刚新建的test.txt还是个空文件,那我可不可以通过java写点文字进去呢?或是写完了再读出来?没问题,用java控制文件读写也是很常用的操作。在java里文件是以“流”的形式操作的。大家都见过水流,估计有些人在科技馆还看见过电流。它们都沿着一个固定的方向,从一端涌向另一端。文件流的道理一样,它也在两端流动,只不过一端叫硬盘,另一端叫内存。水流默认情况的流向是从高到低,现代技术可以让它从低到高。既然水流可以双向流动,文件流自然也可以。所以,把一段文字写入文件的过程就是文件流从内存流向硬盘的过程,我们管它叫输出流;反过来,把一段文字从文件中读出来的过程就是文件流从硬盘流向内存的过程,我们管它叫输入流。
输入输出流又叫做I/O流。注意,我一直在说“一段文字”,其实指的就是文件的内容。有人说不对呀,有些文件的内容并不是文字呀?比如我自拍的照片,我藏在本本深处的岛国小片片。不错,图片的后缀名通常是.jpg/.png/.bitmap,视频多为.avi/.mkv/.mp4等等,但你如果用记事本方式打开会看见里面有很多乱码,其实它们也都是文字,而且并不陌生,正是我们之前提到的字节码,是一组二进制码。我们不喜欢字节码,因为看不懂,相比之下,还是看得懂的容易处理。我们把那些写在文本文件里的人类语言比如汉语英语叫做字符流,而看不懂的非人类字节码则被称为字节流。所以,都是“一段文字”,只不过字节字符之分而已。
可惜的是,文件对象本身并不能实现读写,你看刚才File f = new File里的f并没有任何方法可以做读写操作。但文件流也像文件对象一样,可以实例化,它的对象就可以处理读写了。
先从简单的说,字符流。通过java文档我们知道,负责它的输入流的类叫做FileReader,实例化语句是
输入流对象fr可以进行读取文件内容的操作,它实例化时接收一个参数,就是文件的对象。
我们实践一下,看下面程序:
FileReader也有可能会抛异常,我们这次用个try…catch语句处理,别着急,之后介绍异常的时候都会说到。根据java文档,我们介绍两种比较常用的字符流读取方法,第一个是read():用FileReader的对象每次调用read()都会读下一个字符,并返回一个整型数值,这个整型数值就是字符的ASC码。记得讲类型转换的时候给大家看过字符和ASC码的对照表格,每一个字符都对应一个数值,其实说白了就是用一个数值来代表一个字符。
读完文件最后一个字符的时候,如果这时你还调用read()就会返回-1,表示已经读完了。知道了用法,我们继续完善程序,用read()方法完成文件读取过程:
fr.read()返回的整型数值(ASC码)我用一个整型变量n存储。一开始n=0,第一次调用read()之后n的值就会改变,毕竟读了一个字符嘛。既然n=-1代表读完,那只要不等于1的情况都是在读,因此我就可以用一个while循环来控制读取过程,不是-1代表没读完,那就继续读。返回的n值由于是整型,所以我们还得用个强制转换char c = (char) n强制转回来,这点挺讨厌。转换完再读下一个字符,然后走循环再判断,如果满足条件继续读,如此往复,直到不满足条件证明已读完,跳出循环,程序结束。注意,回车也是字符,也会被打印,所以整个文档打印出来和你文档里的内容是一致的。
程序写到这儿还差一步,也是很多人容易犯的错误。不管是读还是写,文件流操作结束一定要关闭,否则非常浪费资源。关闭的方法是close(),而且关闭过程一定要在finally语句块里,代表不管有没有抛异常文件流都将强制关闭。我们修改一下程序,最终效果是:
有些人说每次读一个字符太慢了,于是我们就有了第二个方法read(char[] cbuf)。它的工作原理也是从输入流中读字符,不过你可以指定每次读几个字符。它里面有个字符数组的参数,就是用来指定读多少个字符的。这个方法的意思就是假设有一个字符数组,每次把和这个数组空间等量的字符读进去。这时的返回值不再表示ASC码,而是读到的字符数。注意,方法每调用一次都会清空当前的字符数组,然后装下一次读取的字符:
假如我每次想读200个字符,那我可以声明一个200字符的数组,然后把数组作为参数传进去。够200就读200,能装满就装满,不够就能读多少读多少:
String line = new String(arr_c, 0, n)这句代码中的0代表当前数组arr_c中所有字符的第一个字符,而n值是实际读取字符的个数。再说一遍,这时的n值就不再是字符的ASC码了,而是实际读取字符的个数。整句代码表示把每次读出来的所有字符组成一个字符串打印。按照上图那个例子,第一次打印出"Happy new ",第二次打印出"year how a",第三次打印出"re you eve",以此类推,一直打印出文件中全部的内容。n=-1时读取工作结束,跳出循环,程序结束。
有输入流就有输出流,也就是写的操作。负责字节流的输出流对象叫FileOutputStream,输入是input,输出就是output,很容易记。它的实例化语句是
常用的字符流写方法也有好几个,我们讲两个。第一个是write(int c),第二个是write(String str)。聪明的朋友肯定一下就猜到了,这两者不就是和读操作那两个方法对应的吗?没错。举个例子,比如我现在想把test.txt文件复制一下,那就是无非把原文件的数据先读出来,然后再写到一个新文件里。我把新文件叫test1.txt,先演示write(int c):
前半部分其实和read()的演示没什么区别,只不过这回是每次读出来一个字符后不直接打印出来,而是用fw.write(n)把它直接写到test1.txt里。如果你还是嫌慢,想每次读写多个字节那就用write(String str):
这个方法对应read(char[] cbuf)这个方法。我每次读200个字符,然后把它们组成字符串一起写到文件里。需要注意的是,不管你用write(int c)还是write(String str),必须在finally块中调用close()方法,否则文件内容写不进去。
以上两种写的方式都可以,但更推崇write(String str)这种方式,因为每次写一个会大大增加对磁盘的操作次数,次数多了就会影响它的寿命,甚至还有划坏的可能。而依靠read(char[] cbuf)有了字符数组就不一样了,它就好比一个装数据的缓存,每次读取一个固定长度的字符数,比如例子里的200,每次装满了才变成字符串一口气倒到硬盘里,以此来降低硬盘的压力。你看read(char[] cbuf)这个方法里cbuf中的c代表char,buf代表buffer,翻译过来是缓存,也就是字符缓存的意思。
既然可以缓存,java设计者干脆又设计了一种字符流,就叫作缓冲字符流。它既不是读一个字符,也不是读一组字符,而是干脆直接读字符串!假如文件中的内容是一行一行的(中间有换行符),那每次读取默认就是一行(不包括换行符)。缓冲字符流是字符流的一种表现形式,它的读取格式是:
写的格式是:
还是复制test.txt里的内容到test1.txt。因为test.txt里有四行,每行末尾有一个回车符,所以可以用缓冲字符流:
br.readLine()会每次读取以换行符结尾的一行字符串,当这个字符串存在时则写到文件里。line=null表示没读出来,没读出来意味着要么文件里没内容,要么就是到了最后一行,这时就要跳出循环。自动化测试时测试数据一般会一行一行排开,所以我们还会用到缓冲字符流。
字符流的操作差不多就是这些,这篇文章的源代码是FileOperations,FileCharRead,FileCharReadCharBuffer,FileCharWrite,FileCharWriteCharBuffer,FileCharStringBuffer六个项目。下一篇讲字节流的操作。
本篇知识点及注意事项:
1. 文件和文件流都可以实例化,实例化的文件流可以对文件进行读写。
2. 文件流分为字符流和字节流。
3. 字符流可以一个字符一个字符进行读写,也可以一次性读写一组字符。