poi将word2007转换成html

1:导入jar包依赖

       <dependency>
           <groupId>org.apache.poi</groupId>
           <artifactId>poi-scratchpad</artifactId>
           <version>3.10.1</version>
       </dependency>
      <dependency>
           <groupId>org.apache.xmlbeans</groupId>
           <artifactId>xmlbeans</artifactId>
           <version>2.6.0</version>
      </dependency>
      <dependency>
           <groupId>fr.opensagres.xdocreport</groupId>
           <artifactId>org.apache.poi.xwpf.converter.core</artifactId>
           <version>1.0.6</version>
      </dependency>
      <dependency>
           <groupId>fr.opensagres.xdocreport</groupId>
           <artifactId>org.apache.poi.xwpf.converter.xhtml</artifactId>
           <version>1.0.6</version>
       </dependency>       

2:创建工具类,便于后面直接调用即可

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;

import org.apache.poi.xwpf.converter.core.FileImageExtractor;
import org.apache.poi.xwpf.converter.core.FileURIResolver;
import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;

public class WordtoHtml07 {
   
   public static void word07ToHtml(String fileName ,String imageFile , String htmFile) throws IOException{
       File f = new File(fileName);
       if (!f.exists()) {
           System.out.println("sorry file does not exists");
       }else{
           if (f.getName().endsWith(".docx")|| f.getName().endsWith(".DOCX") || f.getName().endsWith(".doc")) {
               //1:加载文档到XWPFDocument
               InputStream in = new FileInputStream(f);
               XWPFDocument document = new XWPFDocument(in);
               //2:加载图片到指定文件夹
               File imgFile = new File(imageFile);
               XHTMLOptions options = XHTMLOptions.create().URIResolver(new FileURIResolver(imgFile));
               options.setExtractor(new FileImageExtractor(imgFile));
               
               //3:转换XWPFDocument to XHTML 
                 OutputStream out = new FileOutputStream(new File(htmFile));  
                   XHTMLConverter.getInstance().convert(document, out, options);  
           }else{
                 System.out.println("Enter only MS Office 2007+ files");           
           }           
       }           
   }      
   public static void main(String args[]) {  
       try {           
           word07ToHtml("F:/51/1.doc","F:/51/media","F:/51/1.htm");
       } catch (IOException e) {  
           // TODO Auto-generated catch block  
           e.printStackTrace();  
       }  
   }   
}

附:简单的实现了word 转换成html ,欢迎各路大神补充在项目中遇到的其他需求,完善工具类的封装,谢谢

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,049评论 25 709
  • 冰雪消融 你要离开 你说 只愿面朝大海春暖花开 我把 ...
    蜀锦2阅读 245评论 0 0
  • 人,一定要悟透自己。学会欣赏自己,学会把握自己,学会心疼自己。心再累,也不要纵容自己的脾气;心再痛,也要许给...
    心伤so想爱阅读 613评论 3 2
  • 亭台飞檐青山远, 翠雕粉琢幽谷间。 风轻云淡艳阳天, 携妻将女自悠然。
    沧海涤尘阅读 359评论 0 1
  • 第一章 合 汐,生活在一个幸福的家庭,父亲是一家杂志社老板,高大挺拔,风趣幽默,有一定的亲和力;母亲是作...
    鑫鑫啊喂阅读 237评论 2 9