c# htmllagility Pack -无法获取图像src

本文关键字:获取 图像 src htmllagility Pack | 更新日期: 2023-09-27 18:02:17

我正试图学习如何从URL获取所有img src。但是,我的代码中的imgs变量总是null。我做错了什么?

static void Main(string[] args)
{
    HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
    doc.LoadHtml("http://archive.ncsa.illinois.edu/primer.html");
    HtmlAgilityPack.HtmlNodeCollection imgs = doc.DocumentNode.SelectNodes("//img");
    if (imgs != null)
    {
        foreach (HtmlAgilityPack.HtmlNode img in imgs)
        {
            string imgSrc = img.Attributes["src"].Value;
        }
    }
    Console.ReadKey();
}  

c# htmllagility Pack -无法获取图像src

你正在使用HtmlDocument。LoadHtml,它被设计为获取html源而不是url。

你可以使用WebClient来获取html,例如

WebClient wc = new WebClient();
string html = wc.DownloadString("http://archive.ncsa.illinois.edu/primer.html");
doc.LoadHtml(html);

HtmlDocument还支持Load,允许从各种其他来源加载内容。