Java Serialization(Java 序列化)

序列化是什么



信息的传递、交换支撑整个互联网产业,那么信息的交流的过程中遵循着什么样的标准。常见的网络传输协议有 TCP/IP 协议,OSI协议等模型。我们的通讯协议往往根据不同的应用场景采用不同分层模型,因不同模型功能定义不一样,因此粒度的划分也有所不同,比如:TCP/IP协议是一个四层协议,而OSI模型却是七层协议模型。

在 TCP/IP 协议模型中分为:网络接口层、网际层、传输层、应用层。OSI 协议模型分为:物理层、数据链路层,网络层、传输层、会话层、表示层以及我们的应用层。

在 OSI 模型中的表示层主要负责把应用层中应用程序的对象转换成对应的二进制串或者将二进串转换成我们应用程序中对象。而这两个转换的过程便被称作为序列化和反序列化,因此序列化和反序列属于通信协议的一部分。就一般而言,TCP/IP 模型中的应用层对应着 OSI 模型中的应用层、展示层、会话层, 因此序列化协议属于 TCP/IP 协议应用层的一部分。

+ 序列化和反序列化属于通信协议的一部分。
+ 序列化:将数据结构(C)或对象(java)转换成二进制串的过程。
+ 反序列化:将在序列化过程中所生成的二进制串转换成数据结构(C)或者对象(java)的过程。

序列化有什么特点



序列化协议的实现有很多种,Java Serialization 只是众多实现方式中的一种。好的序列化实现方式需要从以下点去考虑:通用型、强壮性、可扩展性/兼容性以及安全性。

  • 通用性
    序列化是否支持跨平台、夸语言,学习成本是否足够低,以及流行度怎么样;流行度从侧面也反映该它对跨平台、跨语言的支持度,以及它社区活跃度等等。

  • 强健性
    强壮性也被称为鲁棒性。一门好的技术,工具框架往往是经过长的时间去持续的优化、大而全的测试,慢慢被大众所接受。但是,为了支撑跨平台、跨语言或者是支持某一中特性去牺牲我们的强健性。

  • 可调试性/可读性
    序列化和反序列化作用于对象和二进制间相互转化的过程。在转化的过程一旦出错,由于二进制数据的不可读性,那么就可能需要花费大量的时间去调试。因此实现方案有没有提供相应的文档、调试工具、平台作为支撑这也是在技术选型的过程需要考量的。

  • 性能
    讨论性能就是讨论时间复杂度、空间复杂度。就 Java 而言,序列化将会在需要序列化的实例对象上加上类描述,数据上加上字段描述以用于反序列化。这样不仅增加了在网络传输的过程中带宽的开销,也增加了在持久化的过程中磁盘的开销。再有复杂的实现方式在序列化和反序列化都会增加相应的时间开销。

  • 可扩展性/兼容性
    在当下的互联网时代,出陈推新,软件迭代非常快,应用程序中的业务实体对象字段的增减是否支持就服务,对以前经过序列化而持久化的数据在反序列化的过程是否兼容?

  • 安全性/访问限制
    序列化会把业务数据完全存储到二进制流中,而且这个过程是可逆的、可见的,因此给安全带来了极大的挑战。

Java 序列化的代价

降低了“改变这个类的实现”的灵活性

如果你的类实现了序列化,而且这个类得到了广泛的应用,就得持久支持此类的序列化形式。而倘若你的实现方式仅仅采用的是 Java 默认的实现方式,那么这种序列化形式将会永远束缚这个类最初的内部表示方法(功能代码等)。接受了这种默认的序列化形式,以后需要改变这个类的内部结构就有可能导致前后序列化形式的不兼容,使用新的版本进行反序列有可能导致失败。

每个可序列化的类都有一个都有一个唯一的标识号与其关联,也就是我们通常说的 serialVersionUID。如果可序列化的类没有显示的声明该常量,Java 虚拟机会自动根据这个类调用一个复杂的运算过程,从而在产生运行时的 serialVersionUID。这个自动生成的值将会受到类名、实现的接口名称、以及所有的公有方法和受保护的成员名称所影响。如果你通过任何方式改变了这些信息,兼容性都会遭到破坏,在运行时会导致 InvalidClassException 异常。

如果你没有显示的声明 serialVersionUID,就算类的信息没有发生改变,在跨 Java 虚拟机进行反序列化的时候也有可能失败。不同 Java 虚拟机序列化的实现方式上可能有所不同,这些细微的差别都有可能导致运行时生成的 serialVersionUID 不一致从而导致反序列化失败。

它增加了出现BUG和安全漏洞的可能性

序列化给我们的应用程序会带来一系列的安全问题。无论是接收了默认的序列化行为,还是实现自己的了序列化方法,反序列化就像提供了一个“隐藏的构造器”,它具备了和其他构造器相同的特点,这样就为攻击者留下了攻击的漏洞。最典型的就是 Struts 2.x 经常爆出反序列化的漏洞。

随着版本的迭代更新,相关的测试负担也增加

当一个可序列类被修订后,很重要的一点是,要检查是否可以“在新版本中序列化一个实例,然后在旧版本中是否可以被反序列化。旧版本中序列化的实例在新版本中是否仍可以做反序列化操作”。因此,测试所需要的工作量与“可序列化类的数量和发行的版本号”的乘积成正比。因此在最初编写一个可序列化类的时候就应该精心设计自定义的序列化形式,这样测试的要求便会降低。

Java 序列化应该知道几件事

序列化ID问题 (serialVersionUID)

虽然两个类的功能代码完全一致,但是序列化 ID 不同,他们无法相互序列化和反序列化。Eclipse 提供了两种生成策略:一个是固定的 1L;一个是随机生成一个不重复的 long 类型数据(实际上是使用 JDK 工具 serialver 生成)。在没有特殊需求,采用默认的就好,这样可以确保代码一致时反序列化成功。

静态变量序列化

Java 序列化是不保存静态变量。Java 序列化的本质是为了存储、传输实例对象数据,序列化的是实例对象的成员变量,而静态变量、常量都属于类的成员。

父类的序列化与 Transient 关键字

一个子类实现了 Serializable 接口,它的父类都没有实现 Serializable 接口,序列化该子类对象,然后反序列化后输出父类定义的某变量的数值,该变量数值与序列化时的数值不同。

要想将父类对象也序列化,就需要让父类也实现Serializable 接口。如果父类不实现的话的,就 需要有默认的无参的构造函数。在父类没有实现 Serializable 接口时,虚拟机是不会序列化父对象的,而一个 Java 对象的构造必须先有父对象,才有子对象,反序列化也不例外。所以反序列化时,为了构造父对象,只能调用父类的无参构造函数作为默认的父对象。因此当我们取父对象的变量值时,它的值是调用父类无参构造函数后的值。如果你考虑到这种序列化的情况,在父类无参构造函数中对变量进行初始化,否则的话,父类变量值都是默认声明的值,如 int 型的默认是 0,string 型的默认是 null。

Transient 关键字的作用是控制变量的序列化,在变量声明前加上该关键字,可以阻止该变量被序列化到文件中,在被反序列化后,transient 变量的值被设为初始值,如 int 型的是 0,对象型的是 null。

对敏感字段加密(模糊化数据)

我们的实体对象可能存在敏感数据,比如年龄、身份信息,银行卡号等等。由于在某一些业务场景会在网络中进行传输,也有可能持久化到日志文件、硬盘、数据库等,这时候便需要读该部分数据进行模糊化处理,甚至是加密签名等处理。这样这些信息只能通过反序列化才能进行有效的读取,一定程度保证序列化对象的数据安全。

使用序列化代理代替序列化实例

前面谈到实现 Serializable 接口,会增加出错和出现安全问题的可能性,因为他是跳出使用普通构造方法之外的机制来创建的实例对象,然可使用序列化代理模式会大大的降低此类的风险。

Java 序列化的简单应用(Java clone)



Java 序列化较为常见的就是用于深克隆,前提是需要克隆的对象实现了序列化。

private static Serializable clone(Serializable object) throws IOException, ClassNotFoundException{
        //将对象写到流里  
         ByteArrayOutputStream bo =new ByteArrayOutputStream();  
         ObjectOutputStream oo=new ObjectOutputStream(bo);  
         oo.writeObject(object);  
         
         //从流里读出来  
         ByteArrayInputStream bi=new ByteArrayInputStream(bo.toByteArray());  
         ObjectInputStream oi=new ObjectInputStream(bi);
         
        return (Serializable) oi.readObject();  
    }

Java 序列化基本实现

在Java中,只要一个类实现了java.io.Serializable接口,那么它就可以被序列化。

Person.java

package me.knight.serialize.model;

import java.io.Serializable;

public class Person implements Serializable{
    /**
     * 
     */
    private static final long serialVersionUID = 1L;
    private String name;
    private Address addr;

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public Address getAddr() {
        return addr;
    }
    
    public void setAddr(Address addr) {
        this.addr = addr;
    }

    @Override
    public String toString() {
        return "Person [name=" + name + ", addr=" + addr + "]";
    }
}

Address.java

package me.knight.serialize.model;

import java.io.Serializable;


public class Address implements  Serializable{
    
    /**
     * 
     */
    private static final long serialVersionUID = 1L;
    
    private String street;

    public String getStreet() {
        return street;
    }

    public void setStreet(String street) {
        this.street = street;
    }

    @Override
    public String toString() {
        return "Address [street=" + street + "]";
    }
    
}

SerializeUtil.java

package me.knight.serialize;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;

import me.knight.serialize.model.Address;
import me.knight.serialize.model.Person;

public class SerializeUtil {
    public static void main(String[] args) throws IOException,
            ClassNotFoundException {
        Person origin = getPerson();
        serialize(getPerson());
        
        Person clone = deserializePerson();
        
        System.out.println("p1 和 p2 是否是同一对象:" + (origin == clone));
        System.out.println("p1:" + origin);
        System.out.println("p2:" + clone);
        
        System.out.println("p1 和 p2 是否是同一对象:" + (origin.getAddr() == clone.getAddr()));
        System.out.println("p1 和 p2 的地址是否相同:" + origin.getAddr().toString().equals(clone.getAddr().toString()));
    }

    public static Person serialize(Person person) throws IOException {
        // ObjectOutputStream
        // 对象输出流,将Person对象存储到D盘的serialize_person文件中,完成对Person对象的序列化操作
        ObjectOutputStream oo = new ObjectOutputStream(new FileOutputStream(
                new File("D:/serialize_person.txt")));
        oo.writeObject(person);
        System.out.println("Person对象序列化成功!");
        oo.close();

        return person;
    }

    private static Person deserializePerson() throws IOException,ClassNotFoundException {
        @SuppressWarnings("resource")
        ObjectInputStream ois = new ObjectInputStream(new FileInputStream(new File("D:/serialize_person.txt")));
    
        Person person = (Person) ois.readObject();
        System.out.println("Person对象反序列化成功!");
        return person;
    }

    private static Person getPerson() {
        Person person = new Person();
        person.setName("非典型程序员");

        Address addr = new Address();
        addr.setStreet("程序员胡同168号");

        person.setAddr(addr);

        return person;
    }
}

输出结果

Person对象序列化成功!
Person对象反序列化成功!
p1 和 p2 是否是同一对象:false
p1:Person [name=非典型程序员, addr=Address [street=程序员胡同168号]]
p2:Person [name=非典型程序员, addr=Address [street=程序员胡同168号]]
p1 和 p2 是否是同一对象:false
p1 和 p2 的地址是否相同:true
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • JAVA序列化机制的深入研究 对象序列化的最主要的用处就是在传递,和保存对象(object)的时候,保证对象的完整...
    时待吾阅读 10,834评论 0 24
  • 从三月份找实习到现在,面了一些公司,挂了不少,但最终还是拿到小米、百度、阿里、京东、新浪、CVTE、乐视家的研发岗...
    时芥蓝阅读 42,169评论 11 349
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,560评论 18 399
  • (一)看烟火 小镇每年正月十五,都会在镇政府门口的广场上放烟火。那是一年最盛大的日子了,父母带着我们早早去广场占据...
    chenum1阅读 392评论 0 0
  • 三月的一个早晨,一串清脆婉转的黄鹂歌声把我从久久的冬眠中唤醒。我睁开眼睛好奇的欣赏着这世界。三月的早晨,天...
    BlueCute阅读 227评论 0 2