如何使用c代码提取html页面的特定部分
本文关键字:定部 html 何使用 代码 提取 | 更新日期: 2023-09-27 18:28:18
我有一个网页。我想提取页面的特定部分,但不是整页。例如,从网站页面顶部向左4英寸,向右4英寸。请指导我如何做到这一点。这是我的密码。
public string GetWebSiteContents(string url)
{
WebRequest req = WebRequest.Create(url);
// Get the stream from the returned web response
StreamReader sr = new StreamReader(req.GetResponse().GetResponseStream());
System.Text.StringBuilder sb = new System.Text.StringBuilder();
string strLine;
// Read the stream a line at a time and place each one into the stringbuilder
while ((strLine = sr.ReadLine()) != null)
{
// Ignore blank lines
if (strLine.Length > 0) sb.Append(strLine);
}
sr.Close();
textBox1.Text = sb.ToString();
return sb.ToString();
}
这段代码运行良好,但提取了整页内容,需要花费大量时间。
实现您想要做的事情的一个简单方法是使用Selenium等工具来自动化真实的浏览器,然后使用HTML标记,您可以检索保存的任何信息,例如页面左侧的div或表中的信息。查看此示例以获取有关Selenium的教程。