如果没有microsoft.office.interop,我如何将PDF转换为doc ?

本文关键字:PDF 转换 doc office microsoft interop 如果没有 | 更新日期: 2023-09-27 17:51:24

我需要使用c#将PDF文件转换为。doc文件。这台电脑虽然没有安装Office软件,但没有文件系统。有什么好主意吗?我做了一些调查,大多数人使用互操作服务。

如果没有microsoft.office.interop,我如何将PDF转换为doc ?

您需要了解PDF并不是真正作为单一文档格式实现的。

如果您的PDF文档是通过将文本呈现为PDF文件创建的,那么直接转换PDF不仅是可能的,而且非常好(可靠)。

如果PDF的来源是扫描仪或传真(本质上是扫描仪…),那么你得到的是一个带有文本"图片"的文档。这种情况更难以处理。如果您为此打开标记,则没有要转换的"文本"。在这种情况下,您必须处理由于各种问题而不太可靠的OCR(光学字符识别)方式。

如果您可以在数据呈现为PDF之前拦截数据(例如在SSRS或Crystal中),那么您最好绕过PDF阶段并将数据移动到Word文档中。

如果您不得不接收传真,然后需要解释其内容,请准备好迎接OCR地狱。我离开那里已经有一段时间了,所以我希望一切都好起来了。

即使您的机器上没有安装office,您也可以(使用Visual studio)访问office开发人员工具包,该工具包将允许您构建以Word格式分发的文档(.doc/.docx)。

可以选择将PDF转换为Html,以便在Word中打开。

使用aspose PDF工具包将PDF转换为文本,然后使用fileststream或aspose doc将文本转换为文档