如何将HtmlNode及其所有子体序列化回HTML
本文关键字:序列化 HTML HtmlNode | 更新日期: 2023-09-27 18:24:48
我使用Html敏捷包从Html源代码中提取信息。
我发现一个HtmlHode像这样:
doc.DocumentElement.SelectNodes("//div[@id='toc']"]
我的问题是,有没有一种方法可以让我将HtmlNode及其所有子代序列化回HTML字符串?
如果有办法输出TEXT节点的子体?
您可以从OuterHtml
属性访问HTML标记:
var nodes = doc.DocumentElement.SelectNodes("//div[@id='toc']");
foreach(HtmlNode node in nodes)
{
string html = node.OuterHtml;
.....
}
关于最后一个问题,我不太清楚输出文本节点子体是什么意思。如果您的意思与XPath的string()
函数类似(返回所有文本节点子体的串联字符串),您可以尝试InnerText
属性(请澄清是否这不是您想要的功能) 恐怕库中没有这样做的内置方法。您需要编写自己的方法/代码来实现这一点