HtmlAgilityPack scraping "href"

本文关键字:quot href scraping HtmlAgilityPack | 更新日期: 2023-09-27 18:27:37

我写了这段代码

警告,链接指向成人网站!!!

        var getHtmlWeb = new HtmlWeb();
        var document = getHtmlWeb.Load("http://xhamster.com/movies/2808613/jewel_is_a_sexy_cougar_who_loves_to_fuck_lucky_younger_guys.html");
        var aTags = document.DocumentNode.SelectNodes("//div[contains(@class,'noFlash')]"); 

        if (aTags != null)
        foreach (var aTag in aTags)
        {
            var href = aTag.Attributes["href"].Value;
            textBox2.Text = href;
        } 

我试着运行这个程序时出错了。

例如,如果我在"var href"中放入其他内容。:

var href = aTag.InnerHtml

我得到了内部文本,我可以在那里看到"href="链接和其他一些数据。

但我只需要href后面的链接!

HtmlAgilityPack scraping "href"

您正在选择div元素。div元素不能具有href属性。如果你想获得锚标签的href,你可以使用:

var hrefs = aTags.Descendants("a")
           .Select(node => node.GetAttributeValue("href","")) 
           .ToList();