首页 > Web开发 > 详细

.net 后台读取pdf的值

时间:2016-07-20 17:40:47      阅读:207      评论:0      收藏:0      [点我收藏+]

在网上找了内容

下载了技术分享这个插件

引用在了项目中

技术分享

然后找到pdf中的位置 进行读取

  string pdfPath = Server.MapPath("~/ViewPatPdf.pdf");
                PDDocument doc = PDDocument.load(pdfPath);
                PDFTextStripper stripper = new PDFTextStripper();
                string txt = stripper.getText(doc);
                Response.Write(txt);

上面是第一种

 下面用itextsharp进行读取

下载itextsharp.dll进行引用

然后写方法

 public string ReadPdfFile(string fileName)
        {
            StringBuilder text = new StringBuilder();
            PdfReader pdfReader = new PdfReader(fileName);
            for (int page = 1; page <= pdfReader.NumberOfPages; page++)
            {
                ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                text.Append(currentText);
            }
            pdfReader.Close();
            return text.ToString();
        }

filename也是pdf的路径

然后就可以读取出来了

这个读取pdf上面的内容,纯粹的把pdf上面的内容进行读取

.net 后台读取pdf的值

原文:http://www.cnblogs.com/jiangyou-lz/p/5688963.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!