将.docx转换为html

本文关键字:html 转换 docx | 更新日期: 2023-09-27 18:14:34

我想把。docx文件转换成。html。我用c#工作。我的代码是:

Microsoft.Office.Interop.Word.Application word = new Microsoft.Office.Interop.Word.Application();
        Microsoft.Office.Interop.Word.Document wordDoc = new Microsoft.Office.Interop.Word.Document();
        Object oMissing = System.Reflection.Missing.Value;
        wordDoc = word.Documents.Add(ref oMissing, ref oMissing, ref oMissing, ref oMissing);
        word.Visible = false;
        Object filepath = @"C:'Users'John'Desktop'begin.docx";
        Object confirmconversion = System.Reflection.Missing.Value;
        Object readOnly = false;
        Object saveto = @"C:'Users'John'Desktop'result.html";
        Object oallowsubstitution = System.Reflection.Missing.Value;
        wordDoc = word.Documents.Open(ref filepath, ref confirmconversion, ref readOnly, ref oMissing,
                                      ref oMissing, ref oMissing, ref oMissing, ref oMissing,
                                      ref oMissing, ref oMissing, ref oMissing, ref oMissing,
                                      ref oMissing, ref oMissing, ref oMissing);
        object fileFormat = WdSaveFormat.wdFormatHTML;
        wordDoc.SaveAs(ref saveto, ref fileFormat, ref oMissing, ref oMissing, ref oMissing,
                       ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing,
                       ref oMissing, ref oMissing, ref oMissing, ref oallowsubstitution, ref oMissing,
                       ref oMissing);

问题是,这并不包括页眉和页脚。它们不在.html结果文件中。我怎样才能把它们包含在结果中呢?

将.docx转换为html

你在Word中看到页眉和页脚的原因是因为你基本上是在打印视图中。在HTML文档中,你处于"草稿"中。样式视图,其中页眉和页脚不存在。您可以为打印时的HTML文档设置不同的样式,称为打印样式表。这个打印样式表只在你在浏览器中打印文档时使用。

另一种选择是将其转换为PDF并允许用户查看PDF,因为大多数浏览器现在要么支持PDF查看,要么有一个插件来支持它。

你也可以将页眉和页脚作为元素添加到html文件中,然后使用一些CSS技巧使元素显示在顶部和底部。这里有一个链接,说明如何做到这一点。

[2]:旧链接重定向到一个俄罗斯网站,要求提供带有"电报"的电话号码;品牌。现在改为web archive of 2012 content