解析word文档

本文关键字:文档 word 解析 | 更新日期: 2023-09-27 18:02:01

我要解析的word文档将具有由word模板定义的已知格式。用户将使用单词模板来创建文档。我需要使用c#解析word文档中的数据,包括下拉列表中的值。这将在SharePoint 2010服务器上完成。推荐的方法是什么?我看到有人提到过Open XML SDK 2.0;我应该用这个吗?如果是这样,我是否需要将.docx转换为XML,然后解析它?在某些情况下,我还必须写Word文档,这应该怎么做?

最好的解决方案将支持Word 2010和2007,但如果2010年的工具明显更好,我也想知道。谢谢。

解析word文档

Office Open XML的文件扩展名为。docx。docx文件可以被描述为几个不同文件的存档。处理word文档中存在的字体、样式和对象的文件。这些文件本身将被描述为XML。