如何转换使用嵌入式字体c#的pdf文本

本文关键字:字体 嵌入式 文本 pdf 何转换 转换 | 更新日期: 2023-09-27 18:28:46

我正在使用iTextSharp将pdf文件转换为文本,但我发现如果pdf具有嵌入式字体或OpenType字体,我无法从pdf中获取文本。有解决方案吗?我只需要转换成文本。感谢您的帮助。谢谢

如何转换使用嵌入式字体c#的pdf文本

作为一个每月处理来自各种不同客户的数千个随机PDF的人,根据我的经验,XpdfText是迄今为止提取文本的最佳库。我们也将iTextSharp用于各种任务,但在提取文本方面还没有发现它那么好。

简短回答

很可能生成的文件没有足够的信息进行正确的文本提取。

请看一下我对一个有点关联的问题的较长回答。