asp.net pdf转化为word(and直接提取内容)

1.首先我们需要一个 Spire.Pdf.

打开vs的Nuget,下载
image.png

然后就是


image.png

引入
using Spire.Pdf;
using Spire.License;

这个例子的作用是将pdf转化为word,并直接打开。
经过测试,如果电脑是micsorft的word可以直接打开,WPS是打开了,但是文件打不开。

PdfDocument doc = new PdfDocument();
        //加载PDF
        doc.LoadFromFile(@"D:\WebApplication2\WebApplication2\123.pdf");
        //调用SaveToFile方法将PDF文档转换为word格式;
        doc.SaveToFile(@"D:\WebApplication2\WebApplication2\123.pdf", FileFormat.DOC);
        System.Diagnostics.Process.Start(@"D:\WebApplication2\WebApplication2\123.pdf");

还有就是注意路径的问题,我的pDF是放到根目录的。

2如何创建一个pdf


image.png
        //Create a pdf document.
        PdfDocument doc = new PdfDocument();
        // Create one page
        PdfPageBase page = doc.Pages.Add();
        //Draw the text
        page.Canvas.DrawString("Hello, I'm Created By SPIRE.PDF!",
        new PdfFont(PdfFontFamily.TimesRoman, 30f),
        new PdfSolidBrush(Color.Black), 10, 10);
        //保存PDF路径
        doc.SaveToFile(@"D:\WebApplication2\WebApplication2\pdf\456.pdf");
        doc.Close();
        Response.Write("成功");

然后用word打开
image.png
image.png

然后就打印出来了,画框的是dll带出来的文字。

3.然后我们创建一个将Html转化为pdf的


image.png

这样就转化好了

4.从PDF中撷取文本


image.png

源码:

protected void Page_Load(object sender, EventArgs e)
{
//复制代码
//Create a pdf document.
PdfDocument doc = new PdfDocument();
// Load the PDF Document
doc.LoadFromFile(@"E:\2018-4-28\2018-4-27\WebApplication2\WebApplication2\45678.pdf");
// String for hold the extracted text
StringBuilder buffer = new StringBuilder();
foreach (PdfPageBase page in doc.Pages)
{
buffer.Append(page.ExtractText().Replace("Evaluation Warning : The document was created with Spire.PDF for .NET.",""));
Response.Write(buffer);
}
doc.Close();
//save text
//String fileName = @"D:\WebApplication2\WebApplication2\pdf\TextInPdf.txt";
//File.WriteAllText(fileName, buffer.ToString());
//buffer = null;
}

buffer.Append(page.ExtractText().Replace("Evaluation Warning : The document was created with Spire.PDF for .NET.",""));

这段代码,是因为我转化的文字每次独有这段话,所以替换了下,替换成空格。


image.png

5.相对路径转化。

image.png

源码:
protected void Page_Load(object sender, EventArgs e)
{
//复制代码
//Create a pdf document.
PdfDocument doc = new PdfDocument();
// Load the PDF Document
string url = System.Web.HttpContext.Current.Server.MapPath(@"~/45678.pdf");
doc.LoadFromFile(url);
StringBuilder buffer = new StringBuilder();
foreach (PdfPageBase page in doc.Pages)
{
buffer.Append(page.ExtractText().Replace("Evaluation Warning : The document was created with Spire.PDF for .NET.",""));
Response.Write(buffer);
}
doc.Close();
}
转化成的效果图。
原文链接:https://www.cnblogs.com/Yesi/p/4289981.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 前言 最先接触编程的知识是在大学里面,大学里面学了一些基础的知识,c语言,java语言,单片机的汇编语言等;大学毕...
    oceanfive阅读 3,124评论 0 7
  • 1. 应该有一个20年的梦想,尽可能地大一些,尽可能抽象一点。因为你知道20年是很长的时间,可以发生任何事情,这个...
    无名韵动阅读 193评论 0 0
  • 今天是520。 不是很懂这样的日子,许多人狂欢庆祝,也有人独自吃饭。 嗯,今天我一个人吃饭。 也是个美好的女孩子,...
    猫夏的少女圆阅读 203评论 0 0
  • 这只知更鸟只唱歌给我们听,什么坏事也不做,他们不吃人们园子里的花果蔬菜,不在玉米仓里做窝,他们只是衷心的为...
    亲爱的小鱼老师阅读 713评论 0 2