如何从pdf文件中提取关键字asp.net c#

本文关键字:关键字 asp net 提取 pdf 文件 | 更新日期: 2023-09-27 18:02:47

我有pdf格式的cv,我想提取关键字NLP(自然语言处理)。以下是附件图片。

但是我不知道怎么做,我是初学者,请帮助我谢谢img img2

如何从pdf文件中提取关键字asp.net c#

有一个叫做iTextSharp的开源库。

你可以上传简历并把它放在服务器的特定路径上,然后你可以阅读它的字符串内容,看看你的文本是否存在,如下所示。

public bool KeywordExists(string keyWord)
{
    using (PdfReader reader = new PdfReader(pdfPath))
    {
        StringBuilder strText = new StringBuilder();    
        for (int i = 1; i <= reader.NumberOfPages; i++)
        {
            strText.Append(PdfTextExtractor.GetTextFromPage(reader, i));
            if(strText.Contains(keyWord)) return true;
        }
        return false;
     }
}