如何使用c#读取.docx文件?

本文关键字:文件 docx 读取 何使用 | 更新日期: 2023-09-27 18:18:03

我想在c#中读取docx文件。docx文件转换成.zip后生成我们文件的XML。我要读xml文件。我需要所有的数据从文档与他们的字体名称(粗体斜体设置),从文件的颜色。我们该怎么做呢?

如何使用c#读取.docx文件?

低级答案:DOCX文件是OPC(开放包装公约)格式(带有清单的zip文件),可以用System.IO.Packaging命名空间中可用的类打开。

高层回答:DocX是一个开源框架,支持使用更高级的结构来操作DocX文件。

DOCX的格式有很好的文档说明。要读取包,您可以使用System.IO.Packaging命名空间中的类。

您将使用Microsoft Office 12.0对象库

如果您能够读取XML文件,那么您可能可以应用一些XPATH查询来获取所需的信息。