使用 iTextsharp 将 PDF 拆分为多个 PDF

本文关键字：PDF 拆分使用 iTextsharp | 更新日期: 2023-09-27 18:31:12

public int SplitAndSave(string inputPath, string outputPath)
    {
        FileInfo file = new FileInfo(inputPath);
        string name = file.Name.Substring(0, file.Name.LastIndexOf("."));
        using (PdfReader reader = new PdfReader(inputPath))
        {
            for (int pagenumber = 1; pagenumber <= reader.NumberOfPages; pagenumber++)
            {
                string filename = pagenumber.ToString() + ".pdf";
                Document document = new Document();
                PdfCopy copy = new PdfCopy(document, new FileStream(outputPath + "''" + filename, FileMode.Create));
                document.Open();
                copy.AddPage(copy.GetImportedPage(reader, pagenumber));
                document.Close();
            }
            return reader.NumberOfPages;
        }
    }

我想将 PDF 拆分为多个 PDF 以 50 页间隔。（如果有 400 页的 PDF，我想要 8 个 pdf）。上面的代码将每个页面拆分为pdf。请帮帮我...我正在将 asp.net 与iTextSharp一起使用。

每次前进页面时，您都会循环浏览 pdf 并创建一个新文档。您需要跟踪您的页面，以便仅每 50 页执行一次拆分。就个人而言，我会将其放在一个单独的方法中，并从您的循环中调用它。像这样：

private void ExtractPages(string sourcePDFpath, string outputPDFpath, int startpage,  int endpage)
{
    PdfReader reader = null;
    Document sourceDocument = null;
    PdfCopy pdfCopyProvider = null;
    PdfImportedPage importedPage = null;
    reader = new PdfReader(sourcePDFpath);
    sourceDocument = new Document(reader.GetPageSizeWithRotation(startpage));
    pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream(outputPDFpath, System.IO.FileMode.Create));
    sourceDocument.Open();
    for (int i = startpage; i <= endpage; i++)
    {
        importedPage = pdfCopyProvider.GetImportedPage(reader, i);
        pdfCopyProvider.AddPage(importedPage);
    }
    sourceDocument.Close();
    reader.Close();
}

因此，在您的原始代码中循环访问您的 pdf，每 50 页调用上述方法。您只需要在块中添加变量即可跟踪开始/结束页面。

这将

很有用。非常符合您的要求

http://www.codeproject.com/Articles/559380/SplittingplusandplusMergingplusPdfplusFilesplusinp

这是一个较短的解决方案。尚未测试哪种方法具有更好的性能。

private void ExtractPages(string sourcePDFpath, string outputPDFpath, int startpage, int endpage)
{
  var pdfReader = new PdfReader(sourcePDFpath);
  try
  {
    pdfReader.SelectPages($"{startpage}-{endpage}");
    using (var fs = new FileStream(outputPDFpath, FileMode.Create, FileAccess.Write))
    {
      PdfStamper stamper = null;
      try
      {
        stamper = new PdfStamper(pdfReader, fs);
      }
      finally
      {
        stamper?.Close();
      }
    }
  }
  finally
  {
    pdfReader.Close();
  }
}

我遇到了同样的问题，但想将iText7用于.NET。在这个具体案例中，这段代码对我有用：

1st：实现自己的PdfSplitter

 public class MyPdfSplitter : PdfSplitter
 {
    private readonly string _destFolder;
    private int _pageNumber;
    public MyPdfSplitter(PdfDocument pdfDocument, string destFolder) : base(pdfDocument)
    {
        _destFolder = destFolder;
    }
    protected override PdfWriter GetNextPdfWriter(PageRange documentPageRange)
    {
        _pageNumber++;
        return new PdfWriter(Path.Combine(_destFolder, $"p{_pageNumber}.pdf"));
    }
}

第二：使用它来拆分您的PDF

using (var pdfDoc = new PdfDocument(new PdfReader(filePath)))
{
    var splitDocuments = new MyPdfSplitter(pdfDoc, targetFolder).SplitByPageCount(1);
    foreach (var splitDocument in splitDocuments)
    {
        splitDocument.Close();
    }
 }

从 Java 迁移的代码示例：https://itextpdf.com/en/resources/examples/itext-7/splitting-pdf-file

希望这对其他人有帮助！