c# htmllagility Pack -无法获取图像src
本文关键字:获取 图像 src htmllagility Pack | 更新日期: 2023-09-27 18:02:17
我正试图学习如何从URL获取所有img src。但是,我的代码中的imgs
变量总是null
。我做错了什么?
static void Main(string[] args)
{
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml("http://archive.ncsa.illinois.edu/primer.html");
HtmlAgilityPack.HtmlNodeCollection imgs = doc.DocumentNode.SelectNodes("//img");
if (imgs != null)
{
foreach (HtmlAgilityPack.HtmlNode img in imgs)
{
string imgSrc = img.Attributes["src"].Value;
}
}
Console.ReadKey();
}
你正在使用HtmlDocument。LoadHtml,它被设计为获取html源而不是url。
你可以使用WebClient来获取html,例如
WebClient wc = new WebClient();
string html = wc.DownloadString("http://archive.ncsa.illinois.edu/primer.html");
doc.LoadHtml(html);
HtmlDocument还支持Load,允许从各种其他来源加载内容。