从屌丝到架构师的飞越(IO流篇)-转换流

一.介绍

字符流=字节流+编码集,在实际读取的时候其实字符流还是按照字节来读取,但是会更具编码集进行查找编码集字典解析相应的字节,使得一次读取出一个字符;

转换流就是原本是字节流,但是读取到的数据是字符,所以我们希望使用字符流来进行操作,那么就可以使用转换流进行转换;

转换流=字节流+编码集。

转换流的特点是可以指定编码集。

转换流的作用:

(1)从控制台读取数据输入(键盘输入),将它们写入到文件(我们写的是字符吧);

(2)当对文件进行解析的时候,如果涉及编码,就需要使用转换流进行解码----乱码可不好玩。

二.知识点介绍

1、System.in与Ssytem.out

2、InputStreamReader与OutputStreamWriter

3、OutputStreamWriter类

4、转换流和子类区别

5、编码表

三.上课视频对应说明文档

1、System.in与System.out

我们常见的System.in与System.out就是典型的字节流,可以直接与控制台进行数据传输。

如:OutputStream os = System.out;

方法阻塞:

当调用这个方法时,程序会进行等待,当方法调用结束后,阻塞结束。

Scanner并不是键盘录入,是文本扫描,可以根据绑定IO资源的不同,扫表不同的文本资源,如果给予文件,则扫描文件,如果给予System.in则扫描键盘录入数据

代码示例:

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.IOException;

import java.io.InputStreamReader;

import java.io.UnsupportedEncodingException;

/*

* 转换流  是 字符流的子类 

*

* 字符流  =  字节流  + 编码表 .  保证了编码表 和 文件的编码 一致 ,能够读取数据成功.

*            编码表和 文件的编码不一致, 乱码.

* InputStreamReader(InputStream in, String charsetName) 创建使用指定字符集的InputStreamReader。

*/

public class Demo {

public static void main(String[] args) throws IOException {

//创建  InputStreamReader 对象

InputStreamReader isr = new InputStreamReader(new FileInputStream("bj.txt"), "utf8") ;

char ch  = (char)isr.read();

System.out.println(ch);

}

}

2、InputStreamReader与OutputStreamWriter

操作字节流对于程序来说过于繁琐,程序员更偏爱操作字符。所以,当面对一些字节流的操作时,我们可以将其转换为字符流再进行操作,这样便非常方便了。

(1)Reader:

InputStreamReader可以完成字节输入流转换为字符输入流

(2)Writer:

OutputStreamWriter可以完成字节输出流转换为字符输出流。

由上边可以知道,转换流是字符流的一种,创建对象时传入对应字节流对象即可完成转换动作。

转换流同样使用了包装的思想,其构造方法接收的同样为IO流对象,并非某个文件资源。关闭转换流的同时即关闭了对应的字节流。

2.1、OutputStreamWriter类

查阅OutputStreamWriter的API介绍,OutputStreamWriter 是字符流通向字节流的桥梁:可使用指定的字符编码表,将要写入流中的字符编码成字节。它的作用的就是,将字符串按照指定的编码表转成字节,在使用字节流将这些字节写出去。

代码示例:

public static void writeCN() throws Exception {

//创建与文件关联的字节输出流对象

FileOutputStream fos = new FileOutputStream("c:\\cn8.txt");

//创建可以把字符转成字节的转换流对象,并指定编码

OutputStreamWriter osw = new OutputStreamWriter(fos,"utf-8");

//调用转换流,把文字写出去,其实是写到转换流的高效区中

osw.write("你好");//写入高效区。

osw.close();

}

OutputStreamWriter流对象,它到底如何把字符转成字节输出的呢?

其实在OutputStreamWriter流中维护自己的高效区,当我们调用OutputStreamWriter对象的write方法时,会拿着字符到指定的码表中进行查询,把查到的字符编码值转成字节数存放到OutputStreamWriter高效区中。然后再调用刷新功能,或者关闭流,或者高效区存满后会把高效区中的字节数据使用字节流写到指定的文件中。

2.2、InputStreamReader类

查阅InputStreamReader的API介绍,InputStreamReader 是字节流通向字符流的桥梁:它使用指定的字符编码表读取字节并将其解码为字符。它使用的字符集可以由名称指定或显式给定,或者可以接受平台默认的字符集。

代码示例:

public class InputStreamReaderDemo {

public static void main(String[] args)throws IOException {

//演示字节转字符流的转换流

readCN();

}

public static void readCN() throws IOException{

//创建读取文件的字节流对象

InputStream in = new FileInputStream("c:\\cn8.txt");

//创建转换流对象

//InputStreamReader isr = new InputStreamReader(in);这样创建对象,会用本地默认码表读取,将会发生错误解码的错误

InputStreamReader isr = new InputStreamReader(in,"utf-8");

//使用转换流去读字节流中的字节

int ch = 0;

while((ch = isr.read())!=-1){

System.out.println((char)ch);

}

//关闭流

isr.close();

}

}

注意:在读取指定的编码的文件时,一定要指定编码格式,否则就会发生解码错误,而发生乱码现象。

3、转换流和子类区别

发现有如下继承关系:

Writer 字符输出流

|- OutputStreamWriter  转换流(字符流—>字节流)(属于字符输出流, 可以指定字符编码表,用来写入数据到文件)

|--FileWriter 操作文件中字符输出流,采用默认的字符编码表

Reader 字符输入流

|- InputStreamReader: 转换流(字节流à字符流)(属于字符输入流, 可以指定字符编码表,用来从文件中读数据)

|--FileReader操作文件中字符输入流,采用默认的字符编码表

父类和子类的功能有什么区别呢?

OutputStreamWriter和InputStreamReader是字符和字节的桥梁:也可以称之为字符转换流。字符转换流原理:字节流+编码表。

FileWriter和FileReader:作为子类,仅作为操作字符文件的便捷类存在。当操作的字符文件,使用的是默认编码表时可以不用父类,而直接用子类就完成操作了,简化了代码。

InputStreamReader isr = new InputStreamReader(new FileInputStream("a.txt"));//默认字符集。

InputStreamReader isr = new InputStreamReader(new FileInputStream("a.txt"),"GBK");//指定GBK字符集。

FileReader fr = new FileReader("a.txt");

这三句代码的功能是一样的,其中第三句最为便捷。

注意:一旦要指定其他编码时,绝对不能用子类,必须使用字符转换流。什么时候用子类呢?

条件:

(1)操作的是文件。

(2)使用默认编码。

总结:

字节--->编码表--->字符 : 看不懂的--->看的懂的。  需要读。输入流。 InputStreamReader

字符--->编码表--->字节 : 看的懂的--->看不懂的。  需要写。输出流。 OutputStreamWriter

4、编码表

4.1、编码表概念

在转换流或者字符串的构造方法当中,我们发现有一个参数始终没有使用,即字符串型的编码集名称。

如果没有指定该名称,则默认为”GBK”,GBK就是编码表的一种。

编码表即字符与存储数据的对应关系表,每一个字符都对应一个数字。

所以,有如下公式:

字符 = 字节 + 编码表

4.2、常用编码表

(1)GBK:中文环境默认码表,中文码表(2个字节对应一个汉字)

(2)GB2312:与GBK基本相同

(3)UTF-8:万国码,JavaEE项目中的通用编码表,包含各国文字编码(一般3个字节对应一个汉字)

(4)ISO8859-1:拉丁码表,不包含中文,是西方较通用的码表

(5)BIG-5:繁体字码表

4.3、编码表使用

乱码:当字符与字节转换过程中使用了不同的码表,会造成乱码的情况。

在字符串中:

当我们将字符串转为对应的数字字节时,需要指定码表,则存储了为该字符该码表对应的数字字节,如果使用了其他码表重写翻译回字符串,则拼写的新字符串会乱码。

在IO中:

与字符串编码表使用类似,当以某个码表写出字节数据时,又使用另外码表展示,会出现乱码。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容