在Java编程中我们会看到源码中或者别人代码中很多实体Bean都实现了Serializable接口,但是我很多实体在使用中并没有序列化也能正常使用。由此引发了我的疑问,到底需不要实现Serializable接口?答案是必要,请由我娓娓道来。
概况:
在程序中为了能直接以 Java 对象的形式进行保存,然后再重新得到该 Java 对象,这就需要序列化能力。序列化其实可以看成是一种机制,按照一定的格式将 Java 对象的某状态转成介质可接受的形式,以方便存储或传输。其实想想就大致清楚基本流程,序列化时将 Java 对象相关的类信息、属性及属性值等等保存起来,反序列化时再根据这些信息构建出 Java 对象。而过程可能涉及到其他对象的引用,所以这里引用的对象的相关信息也要参与序列化。
Java 中进行序列化操作需要实现 Serializable 或 Externalizable 接口。
序列化作用:
- 提供一种简单又可扩展的对象保存恢复机制。
- 对于远程调用,能方便对对象进行编码和解码,就像实现对象直接传输。
- 可以将对象持久化到介质中,就像实现对象直接存储。
- 允许对象自定义外部存储的格式。
何时需要序列化:
在存储时需要序列化,这是肯定的。大家知道的是序列化是将对象进行流化存储,我们有时候感觉自己在项目中并没有进行序列化操作,也一样是存进去了,那么对象需要经过序列化才能存储的说法,似乎从这儿就给阉割了。事实究竟是怎样的呢?
首先看我们常用的数据类型类声明:
public final class String implements java.io.Serializable, Comparable<String>, CharSequence
public class Date implements java.io.Serializable, Cloneable, Comparable
而像其他int、long、boolean类型等,都是基本数据类型,数据库里面有与之对应的数据结构。从上面的类声明来看,我们以为的没有进行序列化,其实是在声明的各个不同变量的时候,由具体的数据类型帮助我们实现了序列化操作。
拿到这儿的时候,就又有一个问题,既然实体类的变量都已经帮助我们实现了序列化,为什么我们仍然要显示的让类实现serializable接口呢?
请注意我以上的说法:首先,序列化的目的有两个,第一个是便于存储,第二个是便于传输。我们一般的实体类不需要程序员再次实现序列化的时候,请想两个问题:第一:存储媒体里面,是否是有其相对应的数据结构?第二:这个实体类,是否需要远程传输(或者两个不同系统甚至是分布式模块之间的调用)?
如果有注意观察的话,发现序列化操作用于存储时,一般是对于NoSql数据库,而在使用Nosql数据库进行存储时,用“freeze”这个说法来理解是再恰当不过了,请在NoSql数据库中,给我找出个varchar,int之类的数据结构出来? 如果没有,但我们又确实需要进行存储,那么,此时程序员再不将对象进行序列化,更待何时?
备注:如果有人打开过Serializable接口的源码,就会发现,这个接口其实是个空接口,那么这个序列化操作,到底是由谁去实现了呢?其实,看一下接口的注释说明就知道,当我们让实体类实现Serializable接口时,其实是在告诉JVM此类可被序列化,可被默认的序列化机制序列化。
然后,需要说明的是,当我们在实体类声明实现Serializable接口时,再次进行观察,会发现这些类是需要被远程调用的。也就是说需要或者可能需要被远程调用,这就是序列化便于传输的用途。
序列化案例:
Father.java
public class Father {
public int f;
}
Son.java
public class Son extends Father implements Serializable {
public int s;
public Son() {
super();
}
}
SerializableMain.java
public class SerializableMain {
public static void main(String[] args) throws IOException, ClassNotFoundException {
// 如果将序列化对象改成父类,则会抛出异常,没有标记为Serializable接口
// Father father = new Father();
Father father = new Son();
father.f = 5;
// 序列化
FileOutputStream fileOutputStream = new FileOutputStream("temp.o");
ObjectOutput objectOutputStream = new ObjectOutputStream(fileOutputStream);
objectOutputStream.writeObject(father);
// 反序列化
FileInputStream fileInputStream = new FileInputStream("temp.o");
ObjectInputStream objectInputStream = new ObjectInputStream(fileInputStream);
Object object = objectInputStream.readObject();
Father f = (Father) object;
// 由于子类没有f这个变量,是调用的父类的f变量
System.out.println(f.f);
}
}
输出结果, f = 0,当父类实现Serializable接口时,f = 5;因此,在实体bean中都应该显示地实现序列化接口。
序列化字段:
在序列化时类的哪些字段会参与到序列化中呢?其实有两种方式决定哪些字段会被序列化,
- 默认方式,Java对象中的非静态和非transient的字段都会被定义为需要序列的字段。
- 另外一种方式是通过 ObjectStreamField 数组来声明类需要序列化的对象。
可以看到普通的字段都是默认会被序列化的,而对于某些包含敏感信息的字段我们不希望它参与序列化,那么最简单的方式就是可以将该字段声明为 transient。
如何使用 ObjectStreamField?举个例子,如下,User 类中有 id、name、age、 和 address 字段,通过 ObjectStreamField 数组声明只序列化 name、age 字段。这种声明的方式不用纠结为什么这样,这仅仅是约定了这样而已。
public class User implements Serializable {
private int id;
// transient 标记的字段不会参与序列化
// private transient String name;
private String name;
private int age;
private String address;
private static final ObjectStreamField[] serialPersistentFields = {
new ObjectStreamField("name", String.class),
new ObjectStreamField("age", Integer.class)
};
...
}