如何获得隐藏的InnerHtml的网页设置的javascript

本文关键字:设置 javascript 网页 InnerHtml 隐藏 何获得 | 更新日期: 2023-09-27 18:18:30

我知道我可以用这个代码获得网页的来源:

browser.DocumentText;

部分由javascript innetHtml函数填充的页面数据在browser.Text中不可见,但在browser的输出中可见。

我怎么能得到由javascript添加到页面的数据的源代码?

如何获得隐藏的InnerHtml的网页设置的javascript

如果您知道哪种类型的标签包含您想要获取的内部HTML,您可以执行如下操作(本示例循环遍历div标签,但您可以执行p或表格单元格或其他操作):

HtmlElementCollection collection = browser.Document.GetElementsByTagName("div");
foreach (HtmlElement element in collection) {
    string html = element.InnerHtml;
    string text = element.InnerText;
    // do something with the HTML or text here...
}

或者,如果您知道要获取的元素的特定ID,则使用:

HtmlElement element = browser.Document.GetElementById("someId123");
if(null != element) // do something with it...

你可以尝试一下htmllagilitypack并遵循这个答案。

HtmlWeb webGet = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = webGet.Load(url);