HtmlAgilityPack scraping "href"
本文关键字:quot href scraping HtmlAgilityPack | 更新日期: 2023-09-27 18:27:37
我写了这段代码
警告,链接指向成人网站!!!
var getHtmlWeb = new HtmlWeb();
var document = getHtmlWeb.Load("http://xhamster.com/movies/2808613/jewel_is_a_sexy_cougar_who_loves_to_fuck_lucky_younger_guys.html");
var aTags = document.DocumentNode.SelectNodes("//div[contains(@class,'noFlash')]");
if (aTags != null)
foreach (var aTag in aTags)
{
var href = aTag.Attributes["href"].Value;
textBox2.Text = href;
}
我试着运行这个程序时出错了。
例如,如果我在"var href"中放入其他内容。:
var href = aTag.InnerHtml
我得到了内部文本,我可以在那里看到"href="链接和其他一些数据。
但我只需要href后面的链接!
您正在选择div
元素。div
元素不能具有href
属性。如果你想获得锚标签的href,你可以使用:
var hrefs = aTags.Descendants("a")
.Select(node => node.GetAttributeValue("href",""))
.ToList();