Html敏捷包链接和img src提取

本文关键字:img src 提取 链接 包链接 Html | 更新日期: 2023-09-27 18:07:50

我有使用图像作为链接的页面,我试图获得href链接以及图像src。问题是我现在正在收集href的fine,但它只获得第一个img src,只是重复。

HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = hw.Load(url);
HtmlNodeCollection linkNodes = doc.DocumentNode.SelectNodes("//a[@href]");
foreach (HtmlNode linkNode in linkNodes)
{
HtmlAttribute link = linkNode.Attributes["href"];
HtmlNode imageNode = linkNode.SelectSingleNode("//img");
HtmlAttribute src = imageNode.Attributes["src"];
string imageLink = link.Value;
string imageUrl = src.Value;
}

谁能告诉我哪里不对或者有别的方法吗?谢谢。

Html敏捷包链接和img src提取

尝试更改

HtmlNode imageNode = linkNode.SelectSingleNode("//img");

HtmlNode imageNode = linkNode.SelectSingleNode(".//img");