零基础 学Java I/O操作

1,背景

想了一下,直接整理操作相关非常的粗糙,说到I/O就应该从更细节的地方入手写,慢慢的整理体系和完善。

2,个人理解

提到I/O相关,就要去了解字节,计算机的数据是由电信号转化的二进制表示的,也就是0或1,计算机中1bit是数据的最小单位,然而1bit太小了对数据而言,仅仅能代表两种状态。我们一般接触到的是1byte(1byte=8bit),也就是1个字节。1个字节能表示2的8次方,0-255一共256种状态,Java默认是UTF-16编码的,基于Unicode字符集,默认是两个字节。

常用的字节大小

int = 4 byte

double = 8 byte

ARGB_8888 4 byte

提到字节,绕不开字符编码,计算机存放数据只能存放数字,所有的字符都会转换为不同的数字,也就是二进制数据,而数据又是如何转化字符的呢,答案是字符集。先说我想表达的结论,unicode是字符集合,对字符集数字化,UTF-8是字符集编码,为更好的存储和传输。UTF-8是unicode的一种编码实现。

常见的字符集

ISO-8859-1 ASCII 数字和西欧字母

GBK GB2312 BIG5 中文

UNICODE (统一码)

本文介绍的

  • ASCII
  • unicode
  • UTF-16
  • UTF-8

ASCII

美国制定的一套字符集,一个字节涵盖了数字化了所有常用的字符,256种状态,大小写英文加数字特殊符号。但是每个国家有自己的文字,如果没有统一的字符集,将会存在乱码的情况。特别是中国汉字数量的庞大。也需要一种统一的字符集来世界通用,也就是unicode。

unicode

unicode旨在统一字符集编码,在最初unicode是用2字节来表示,也就是能表示2的16次方65536种字符,后面为了扩容添加了4个字节的扩展字符集。这样所有涵盖在unicode中的字符都对应着2进制的一种状态。但是字符集定义好了,存储和传输又是两码事了。然后就有了unicode的实现,包括常用的UTF-16 ,GBK,UTF-8。那为什么有了字符集还要编码呢?

UTF-16

没错,既然unicode常用字符集就是2个字节的,那我就存储也用2个字节,因为unicode这个字符集也就是一种编码,再碰到扩展字符集,以特殊符号为界限。就是我们的UTF-16就是这么来编解码。但是这样还会有一个问题,我如果是英文和数字,也要硬生生被编码为两个字节。如果是按unicode方式来存储会造成一定程度上的空间浪费。如果有一种自动伸缩大小的编码不就解决了这种问题吗,在英文数字的时候存1个字节,在汉字的时候存多个字节,这就是下面说的UTF-8。

UTF-8

UTF-8编码就是英文就用ASCII,中文用3个或更多的字节来编码,在二进制的前几位来标识这个位,当前字符有没有结束,是不是还需要继续往下读下一个字节。

preview

可以看到如果一个字节是以“0”开头的,说明是一个ASCII字符,只占一个字节。如果是“11”开头的,说明这个字符占用多个字节。后续每个“10”打头的字节都是这个字符的一部分。

例如:艾

System.out.println(unicode);//十进制输出 System.out.println(Integer.toHexString(unicode));//十六进制输出 System.out.println(Integer.toBinaryString(unicode));//二进制输出 System.out.println((char)unicode);//字符输出

33406
827e
1000001001111110

10000010 01111110 是艾的码元,在内存中是这样的,以utf-8从内存中写入磁盘的时候就是 11101000 10 001001 10 111110 组装了utf8的头变成3个字节,解码也就是去掉这个头按照这个规则。</pre>

总结

计算机存储由二进制组成,没有办法去存储字符,只能去统一字符集,字符集相当于一个大字典,把字节流翻译成字符,例如用utf8编码来控制存储方式。当我们从内存中写入磁盘,由unicode码元拼接utf8头,传输存储,由磁盘读到内存则反之解码,去掉utf8头,以上是我个人理解。

关于字节字符参考 https://www.zhihu.com/question/39262026

文件操作相关

关联上文

image

1,背景

Java I/O,分解成多个来总结。最常见的是基本的文件操作,没有涉及原理性的知识,后续会继续来写。

I/O操作包括对磁盘和网络的操作。

2,本文涉及的类

OutputStream

InputStream

Writer

Reader

BufferedReader

BufferedWriter

3,读写流向

在文件的读写中Java用流的形式来对磁盘进行操作,Out或者是input是相对于程序的内存而言的,一图胜千言。

image.png

流向程序的是input对应的也就是读的操作,流向外部磁盘的也就是out也就是写的操作。

4,OutputStream&InputStream 文件读写

首先写一个文本文件然后再读出来,由上面可知,写是OutputStream是流向磁盘,读是InputStream流向程序。

值得一提的是OutputStream和InputStream 仅支持单字节的读写。

代码示例:

//写入dlai_io_hello并且读取
private static void testWrite_Read() {
    try (OutputStream out = new FileOutputStream("d:/dlai_io/write.txt");
         InputStream in = new FileInputStream("d:/dlai_io/write.txt")) {
        //单字节写入
        out.write('d');
        out.write('l');
        out.write('a');
        out.write('i');
        //字节数组写入
        byte[] bytes = {'_', 'i', 'o'};
        out.write(bytes);
        //String转字节数组写入
        String str = "_hello";
        out.write(str.getBytes());
            
        for (int i = 0; i <= 12; i++)
            System.out.print((char) in.read());

    } catch (IOException e) {
        e.printStackTrace();
    }
}

5,Reader&Writer 文件读写

我个人理解,Reader&和Writer是相当于是OutPutStream&InputStream的一层包装,是因为可以直接操作字符。

private static void test_Reader() {
    File file = new File("d:/dlai_io/write.txt");
    try (InputStream in = new FileInputStream(file);
         Reader reader = new InputStreamReader(in, "gbk")
    ) {
        char[] chars = new char[100];

        int len = 0;
        //如果已到达流的末尾,则返回-1
        while ((len = reader.read(chars)) != -1) {
            reader.read(chars);
        }
        System.out.print(chars);

    } catch (IOException e) {
        e.printStackTrace();
    }
}

//写入hello
private static void test_Writer() {
    File file = new File("d:/dlai_io/write.txt");
    try (OutputStream out = new FileOutputStream(file);
         Writer writer = new OutputStreamWriter(out, "gbk")) {
        char[] hello = {'h', 'e', 'l', 'l', 'o'};

        writer.write(hello);


    } catch (IOException e) {
        e.printStackTrace();
    }
}

可以再加一层缓冲

代码示例:

private static void test_BufferWriter() {
    File file = new File("d:/dlai_io/write.txt");
    try (OutputStream out = new FileOutputStream(file);
         Writer writer = new OutputStreamWriter(out, "gbk");
         BufferedWriter bufferedWriter = new BufferedWriter(writer)) {
        char[] hello = {'i', 'o'};

        bufferedWriter.write(hello);

    } catch (IOException e) {
        e.printStackTrace();
    }
}

private static void test_BufferReader() {
    File file = new File("d:/dlai_io/write.txt");
    try (InputStream in = new FileInputStream(file);
         Reader reader = new InputStreamReader(in, "gbk");
         BufferedReader bufferedReader = new BufferedReader(reader)) {
         System.out.print(bufferedReader.readLine());//读取一行数据

    } catch (IOException e) {
        e.printStackTrace();
    }
}

因为频繁的读写是消耗性能的,BufferedReader&BufferedWriter可以在操作中提供暂存,可以一次性的缓冲数据,暂存可以有效的提高效率。
以上例子执行完函数都会关闭流连接,如果在做写的操作时,并不想关闭连接而立刻体现数据变化,需要进行writer.flush();进行数据的同步。

Socket IO

在Java中TCP连接是用Socket进行封装的,双向通信读写当然也是基于I/O的,先写一个简单的socket示例。
代码示例:Server端


serverSocket = new ServerSocket(9999);

//等待客户端的连接

Socket socket = serverSocket.accept();

//获取输入流

BufferedReader bufferedReader =new BufferedReader(new InputStreamReader(socket.getInputStream()));

//读取一行数据

String str = bufferedReader.readLine();

//输出打印

System.out.println(str);

代码示例:客户端

Socket socket =new Socket("127.0.0.1",9999);

BufferedWriter bufferedWriter =new BufferedWriter(new OutputStreamWriter(socket.getOutputStream()));

String str="server hello";

bufferedWriter.write(str);

bufferedWriter.flush();

socket.shutdownOutput();

未完待续 项目中代码都是运行成功之后才写到简书上的

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352

推荐阅读更多精彩内容

  • 1 I/O流的概念,分类2 I/O所有类的结构图及详解3 何为NIO,和传统I/O有何区别4 在开发中正确使用I/...
    艾剪疏阅读 493评论 0 2
  • 创建一个好的输入/输出(I/O)系统是一项艰难的任务。挑战似乎来自于要涵盖所有的可能性。不仅存在各种I/O源端和想...
    王侦阅读 1,163评论 0 2
  • PrintWriter 缓冲 Java默认的缓冲区大小是8kb的字节缓冲。也就是8192个字节。 缓冲的作用 应用...
    狮_子歌歌阅读 5,431评论 2 3
  • Java.io package 通过数据流,序列化和文件系统提供系统输入和输出。 File 概述 一种文件或目录的...
    狮_子歌歌阅读 1,052评论 1 2
  • I/O的方式通常分为几种,同步阻塞的BIO、同步非阻塞的NIO、异步非阻塞的AIO。 基于不同的IO抽象模型和交互...
    脆皮鸡大虾阅读 466评论 0 0