HTMLAgilityPack - 删除节点而不剥离内部文本

本文关键字:剥离 内部 文本 删除 节点 HTMLAgilityPack | 更新日期: 2023-09-27 18:31:02

我的html内容是

<a href="#asdf">asdf</a>
<H5 align="left"><A href="#d570525d497.htm#toc">Table 
of Contents</A><br></H5>

我正在使用 HTML Agility Pack 来加载 html。我想找到<a>节点并删除节点而不删除其内部文本,如下所述

asdf
<H5 align="left">Table 
of Contents<br></H5>

我正在使用下面的代码,

var htmlDocument = new HtmlDocument();
htmlDocument.LoadHtml(htmlPage);
var Nodes = htmlDocument.DocumentNode.SelectNodes("//a");
foreach (var Node in Nodes)
{
    Node.InnerText.Trim();
}

它不起作用。代码有问题?

HTMLAgilityPack - 删除节点而不剥离内部文本

从父节点中删除节点,同时保留孙级

foreach (var Node in Nodes)
{
    Node.ParentNode.RemoveChild(Node, true); //<-- keepGrandChildren
}
var newhtml = htmlDocument.DocumentNode.OuterHtml;

输出:

asdf
<h5 align="left">Table 
of Contents<br></h5>