如何获得隐藏的InnerHtml的网页设置的javascript
本文关键字:设置 javascript 网页 InnerHtml 隐藏 何获得 | 更新日期: 2023-09-27 18:18:30
我知道我可以用这个代码获得网页的来源:
browser.DocumentText;
部分由javascript innetHtml
函数填充的页面数据在browser.Text
中不可见,但在browser
的输出中可见。
我怎么能得到由javascript添加到页面的数据的源代码?
如果您知道哪种类型的标签包含您想要获取的内部HTML,您可以执行如下操作(本示例循环遍历div标签,但您可以执行p或表格单元格或其他操作):
HtmlElementCollection collection = browser.Document.GetElementsByTagName("div");
foreach (HtmlElement element in collection) {
string html = element.InnerHtml;
string text = element.InnerText;
// do something with the HTML or text here...
}
或者,如果您知道要获取的元素的特定ID,则使用:
HtmlElement element = browser.Document.GetElementById("someId123");
if(null != element) // do something with it...
你可以尝试一下htmllagilitypack并遵循这个答案。
HtmlWeb webGet = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = webGet.Load(url);