package per.qy.dexter.fileoperate;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.List;
import java.util.UUID;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.model.PicturesTable;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.ooxml.extractor.POIXMLTextExtractor;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFPictureData;
import org.junit.Test;
public class WordTest {
@Test
public void testWord() {
// String path = "D:\\temp\\temp\\test.doc";
String path = "D:\\temp\\temp\\test.docx";
String content = null;
File file = new File(path);
if (file.exists() && file.isFile()) {
InputStream is = null;
HWPFDocument doc = null;
XWPFDocument docx = null;
POIXMLTextExtractor extractor = null;
try {
is = new FileInputStream(file);
if (path.endsWith(".doc")) {
doc = new HWPFDocument(is);
// 文档文本内容
content = doc.getDocumentText();
// 文档图片内容
PicturesTable picturesTable = doc.getPicturesTable();
List<Picture> pictures = picturesTable.getAllPictures();
for (Picture picture : pictures) {
// 输出图片到磁盘
OutputStream out = new FileOutputStream(
new File("D:\\temp\\" + UUID.randomUUID() + "." + picture.suggestFileExtension()));
picture.writeImageContent(out);
out.close();
}
} else if (path.endsWith("docx")) {
docx = new XWPFDocument(is);
extractor = new XWPFWordExtractor(docx);
// 文档文本内容
content = extractor.getText();
// 文档图片内容
List<XWPFPictureData> pictures = docx.getAllPictures();
for (XWPFPictureData picture : pictures) {
byte[] bytev = picture.getData();
// 输出图片到磁盘
FileOutputStream out = new FileOutputStream(
"D:\\temp\\temp\\" + UUID.randomUUID() + picture.getFileName());
out.write(bytev);
out.close();
}
} else {
System.out.println("此文件不是word文件!");
}
System.out.println(content);
} catch (FileNotFoundException e) {
} catch (IOException e) {
} finally {
try {
if (doc != null) {
doc.close();
}
if (extractor != null) {
extractor.close();
}
if (docx != null) {
docx.close();
}
if (is != null) {
is.close();
}
} catch (IOException e) {
}
}
}
}
}
java-poi4.0.1读取word文本和图片
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
相关阅读更多精彩内容
- 第一次认识到CALayer是在某次面试时被问到“layer跟view是什么关系”,对layer的一些东西也在开发重...