Java 读取Word批注中的文本和图片

本文将介绍读取Word批注的方法,包括读取Word批注中的文本及图片。下面将通过Java代码来演示如何读取批注。

工具使用:Word类库(Free Spire.Doc for Java 免费版

Jar文件获取:可通过官网下载,下载后解压文件,并将lib文件夹下的Spire.Doc.jar文件导入java程序;也可以通过Maven仓库安装导入,具体路径配置及导入方法可以参考教程

测试文档如下:批注中包含文本和图片

706090-20191119104440251-677711467.png

【示例1】读取批注中的文本

import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import com.spire.doc.fields.Comment; import com.spire.doc.fields.TextRange; public class ReadComment { public static void main(String[] args) { //加载测试文档
        Document doc = new Document();
        doc.loadFromFile("sample.docx"); //实例化String类型变量
        String text = ""; //遍历所有批注
        for(int i = 0;i< doc.getComments().getCount();i++){
            Comment comment = doc.getComments().get(i); //遍历所有批注中的段落
            for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {
                Paragraph paragraph = comment.getBody().getParagraphs().get(j); //遍历段落中的对象
                for (Object object : paragraph.getChildObjects()) { //读取文本
                    if (object instanceof TextRange) {
                        TextRange textRange = (TextRange) object;
                        text = text + textRange.getText();
                    }
                }
            }
        } //输入文本内容
 System.out.println(text);
    }
}

批注文本读取结果:

706090-20191119104321557-505768261.png

【示例2】读取批注中的图片

import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import com.spire.doc.fields.Comment; import com.spire.doc.fields.DocPicture; import javax.imageio.ImageIO; import java.awt.image.RenderedImage; import java.io.File; import java.io.IOException; import java.util.ArrayList; public class ExtractImgsInComment { public static void main(String[] args) throws IOException{ //加载测试文档
        Document doc = new Document();
        doc.loadFromFile("sample.docx"); //创建ArrayList数组对象
        ArrayList images = new ArrayList(); //遍历所有批注
        for(int i = 0;i< doc.getComments().getCount();i++){
            Comment comment = doc.getComments().get(i); //遍历所有批注中的段落
            for(int j= 0;j < comment.getBody().getParagraphs().getCount();j++) {
                Paragraph paragraph = comment.getBody().getParagraphs().get(j); //遍历段落中的对象
                for (Object object : paragraph.getChildObjects()) { //获取图片对象
                    if(object instanceof DocPicture){
                        DocPicture picture = (DocPicture) object;
                        images.add(picture.getImage());
                    }
                }
            }
        } //提取图片,并指定图片格式
        for (int z = 0; z< images.size(); z++) {
            File file = new File(String.format("图片-%d.png", z));
            ImageIO.write((RenderedImage) images.get(z), "PNG", file);
        }
    }
}

批注图片读取结果:

706090-20191119104414265-1964264329.png

愿与诸君共进步,大量的面试题及答案还有资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化、分布式架构等这些成为架构师必备的知识体系,可以微信搜索539413949获取,最后祝大家都能拿到自己心仪的offer

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容