如何使用c代码提取html页面的特定部分

本文关键字:定部 html 何使用 代码 提取 | 更新日期: 2023-09-27 18:28:18

我有一个网页。我想提取页面的特定部分,但不是整页。例如,从网站页面顶部向左4英寸,向右4英寸。请指导我如何做到这一点。这是我的密码。

   public string GetWebSiteContents(string url)
    {
        WebRequest req = WebRequest.Create(url);
        // Get the stream from the returned web response
        StreamReader sr = new StreamReader(req.GetResponse().GetResponseStream());
        System.Text.StringBuilder sb = new System.Text.StringBuilder();
        string strLine;
        // Read the stream a line at a time and place each one into the stringbuilder
        while ((strLine = sr.ReadLine()) != null)
        {
            // Ignore blank lines
            if (strLine.Length > 0) sb.Append(strLine);
        }
        sr.Close();
        textBox1.Text = sb.ToString(); 
        return sb.ToString();
    }

这段代码运行良好,但提取了整页内容,需要花费大量时间。

如何使用c代码提取html页面的特定部分

实现您想要做的事情的一个简单方法是使用Selenium等工具来自动化真实的浏览器,然后使用HTML标记,您可以检索保存的任何信息,例如页面左侧的div或表中的信息。查看此示例以获取有关Selenium的教程。