如何将HtmlNode及其所有子体序列化回HTML

本文关键字:序列化 HTML HtmlNode | 更新日期: 2023-09-27 18:24:48

我使用Html敏捷包从Html源代码中提取信息。

我发现一个HtmlHode像这样:

doc.DocumentElement.SelectNodes("//div[@id='toc']"]

我的问题是,有没有一种方法可以让我将HtmlNode及其所有子代序列化回HTML字符串?

如果有办法输出TEXT节点的子体?

如何将HtmlNode及其所有子体序列化回HTML

您可以从OuterHtml属性访问HTML标记:

var nodes = doc.DocumentElement.SelectNodes("//div[@id='toc']");
foreach(HtmlNode node in nodes)
{
    string html = node.OuterHtml;
    .....
}

关于最后一个问题,我不太清楚输出文本节点子体是什么意思。如果您的意思与XPath的string()函数类似(返回所有文本节点子体的串联字符串),您可以尝试InnerText属性(请澄清是否这不是您想要的功能) 恐怕库中没有这样做的内置方法。您需要编写自己的方法/代码来实现这一点