iTextSharp v5 GetTextFromPage() throws IndexOutOfRangeExcept

本文关键字:throws IndexOutOfRangeExcept v5 GetTextFromPage iTextSharp | 更新日期: 2023-09-27 18:18:20

尝试使用以下代码提取pdf的文本内容:

PdfReader reader = new PdfReader(path);
string strText = string.Empty;
for (int page = 1; page <= reader.NumberOfPages; page++)
{
    string s = PdfTextExtractor.GetTextFromPage(reader, page);
    strText += " " + s;                
}
reader.Close();

NumberOfPages返回257,但是在227页,GetTextFromPage()抛出IndexOutOfRangeException。

任何帮助都是感激的。

hofnarwillie

iTextSharp v5 GetTextFromPage() throws IndexOutOfRangeExcept

我通过将我的iTextSharp版本从5.1更新到5.2来解决这个问题。