word合并

资源id冲突处理

word07之后为xml,对于公式和图片word存储的是external资源:
公式为bin文件,同时存储一份图片,如果公式损坏,或者word无法解析bin文件,则word展示的就只是一个图片
图片存储的是wmf,或者png
每个图片、公式都有一个唯一的编码,xml中引用这些资源的编码
Docx其实就是一个压缩包,将这些图片、bin、xml打包。

所以多个文件合并,会出现不同word中的资源id如果有一样的,则生成的压缩包docx,打开之后会报错,因为同一个资源id对应两个资源,需要对资源重新编号,包括资源id和图片名称。

通过解析xml文件,对要合并的word文件涉及的资源id和资源名称,统一进行重新编码,解决冲突问题。

Docx4j本身是半开源的,word的拆分合并是收费服务,通过我们自己去解析,重新编码也能够做到拆分合并。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,269评论 19 139
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,638评论 25 709
  • Python 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对...
    顺毛阅读 4,267评论 4 16
  • 兜兜转转间,己成为大妈一枚。拒绝回忆,常觉苍白人生无圈可点。 缘份真硬是早注定,高考志愿家人建议学医置之不理。 然...
    福娃儿推阅读 538评论 1 2
  • 小时候很盼望长大,那样就可以做很多大人可以做的事。长大后,才发现有些事也不是那么喜欢,非去做不可。那时好奇的黄毛丫...
    青绿玲孟阅读 270评论 0 2