C# 在执行某些操作之前检查节点

本文关键字:检查 节点 操作 执行 | 更新日期: 2023-09-27 18:37:21

我现在搜索了大约一个小时,但显然我的搜索技巧不是最好的,所以我必须在这里问我的问题......

我使用htmlAgilityPack,我选择这样的日期

HtmlAgilityPack.HtmlDocument htmlDoc        = new HtmlAgilityPack.HtmlDocument();
HtmlAgilityPack.HtmlDocument htmlDocTDs     = new HtmlAgilityPack.HtmlDocument();
HtmlAgilityPack.HtmlDocument htmlDocLink    = new HtmlAgilityPack.HtmlDocument();

htmlDoc.LoadHtml(webBrowser1.DocumentText);
var nodes = htmlDoc.DocumentNode.Descendants("tr").Where(d => d.Attributes.Contains("class") && d.Attributes["class"].Value.Contains("notranslate"));

有了这个,我最终在这里遇到了很多这样的

<tr class="notranslate">
    <td class="hideid">1234567</td>
    <td><a href="/xxx/xxx/xxx-x.xxxx.xxx">aaa-a.aaaaaa.aaa</a></td>
    <td class="mobileHide">cccc</td>
    <td>xx.xxx.xxx.xx</td>
    <td>Mar. 03, 2016 3:43 AM</td>
</tr>

现在继续,我循环它们,因为我想获取所有节点的innerHtml

foreach (HtmlNode node in nodes)
{
    htmlDocTDs.LoadHtml(node.InnerHtml);
    var tds = htmlDocTDs.DocumentNode.Descendants("td");
    foreach (HtmlNode td in tds)
    {
        htmlDocLink.LoadHtml(td.InnerHtml);
        //... here i got stuck
    }
}    

现在实际上我不想要<a href="..">...</a>我也想要这个元素的innerHtml。现在我想做的是检查当前td块是否具有a标签,如果是,则获取其innerHtml

由于我是C#的新手,因此我不太确定如何做到这一点。

这是我创建htmlDoc实例的正确方法吗?

是否可以检查节点?

我可以在不运行 foreach 的情况下选择一个节点吗?

C# 在执行某些操作之前检查节点

哪里开始...首先,不要每次都将InnerHtml解析为文档。这不仅效率低下,而且不可靠,因为InnerHtml可能有多个元素,作为HTML或XML文档(单根)无效。无论如何,片段都不是文档。

我会使用 XPath 来查找和选择元素,检查特定模式或从解析的(主)文档中提取值。有很多资源,只需在SO或Google上搜索XPath HtmlAgilityPack(我不发布链接,因为这些链接可能随时无效)。

可能的 XPath 选择具有您定义的相同约束的 td 节点:

//tr[contains(@class,'notranslate')]/td