从使用Js呈现的站点获取html
本文关键字:站点 获取 html Js | 更新日期: 2023-09-27 18:04:54
此链接指向来自开放营养数据库的文档:
http://www.dabas.com/ProductSheet/Detail.ashx/124494
我试图在xpath
的帮助下从此页获取一些信息。问题是,当我选择"查看源代码"时,为了找出我所追求的标签,我所得到的就是这个:
<!DOCTYPE html>
<html>
<head>
<script src="../../js/jquery-1.3.2-vsdoc2.js" type="text/javascript"></script>
<title>ProductSheetLoader</title>
</head>
<body>
<div style="position:absolute; left:50%; top:50%; width:500px; height:200px; margin-top:-100px; margin-left:-266px; padding:15px; color:#666;">
<h1><img src="../../images/ajax-loader.gif" /> Produktbladet laddas...</h1>
</div>
<input id="hiddenARIDENT" name="ARIDENT" type="hidden" value="124494" />
</body>
<script type="text/javascript">
$(document).ready(function () {
var url2 = "/ProductSheet/Details.ashx/" + $('#hiddenARIDENT').val()
$.ajax({
url: url2,
cache: false,
success: function (respones) {
with (window.document) {
write(respones);
close();
}
}
});
});
</script>
</html>
在我看来,所有的信息都是从其他地方加载的。如果我按下f12
,我可以看到我想要的所有信息,但我如何访问这些信息?这可能吗?
感谢您的帮助。
原始页面只是用ajax加载实际内容,并用它替换文档内容。在这种情况下的实际信息可在/ProductSheet/Details.ashx/124494
,(注意Details.ashx
中的 s
,其中包含实际的页面内容。
一般来说,服务器可能会检查请求是否也包含X-Requested-With: XMLHttpRequest
头,但这里似乎不是这样。