背景
OFD(Open Fixed-layout Documents的简称,意为开放版式文件)版式文档是版面呈现效果高度精确固定的电子文件,其呈现与设备无关。与pdf文件相仿,具有格式独立、版面固定、固化呈现等特点。可以说OFD是中国版的PDF,但是在很多方面的性能优于PDF的同类文档。OFD也逐渐开始在电子发票、电子公文、电子证照等等的领域中应用。
OFD标准有一系列技术优势。首先是体积精简,格式开放,利于理解,长期可读可用;第二,OFD根据我国各领域特色需要进行特性扩展,更深入地贴合了应用需求;第三,OFD标准可支持国产密码算法,是文档安全性的有力保证,也是文件具有法律效力的基本条件;第四也是最重要的一点,OFD标准是自主可控的,国家再有需要对OFD做上面提到的扩展时,特别是在我国党政军严肃类文档应用领域,可以不受控于外部的厂商,我们有自主的标准话语权。这些优势是PDF或以往国内一些厂商的私有文档格式所不具备的。
解析
OFD 文档内部采用可扩展标记语言 XML 来描述数据和结构,体积精简,安全开放,易于扩展。
所以可以将解析OFD格式文件转化为解析XML文件。
- 需要对OFD文件进行解压;
- 获取内部的XML文件,进行解析;
- 解析完成后获得JAVA对象;
涉及到的知识点:
- ZIP压缩文件的读取(
java.util.zip.ZipFile
) - XML的解析(
org.dom4j.Document
)