如何从pdf文件中提取关键字asp.net c#
本文关键字:关键字 asp net 提取 pdf 文件 | 更新日期: 2023-09-27 18:02:47
我有pdf
格式的cv,我想提取关键字NLP(自然语言处理)。以下是附件图片。
有一个叫做iTextSharp的开源库。
你可以上传简历并把它放在服务器的特定路径上,然后你可以阅读它的字符串内容,看看你的文本是否存在,如下所示。
public bool KeywordExists(string keyWord)
{
using (PdfReader reader = new PdfReader(pdfPath))
{
StringBuilder strText = new StringBuilder();
for (int i = 1; i <= reader.NumberOfPages; i++)
{
strText.Append(PdfTextExtractor.GetTextFromPage(reader, i));
if(strText.Contains(keyWord)) return true;
}
return false;
}
}