从使用Js呈现的站点获取html

本文关键字:站点 获取 html Js | 更新日期: 2023-09-27 18:04:54

此链接指向来自开放营养数据库的文档:

http://www.dabas.com/ProductSheet/Detail.ashx/124494

我试图在xpath的帮助下从此页获取一些信息。问题是,当我选择"查看源代码"时,为了找出我所追求的标签,我所得到的就是这个:

<!DOCTYPE html>
<html>
<head>
    <script src="../../js/jquery-1.3.2-vsdoc2.js" type="text/javascript"></script>
    <title>ProductSheetLoader</title>
</head>
<body>
    <div style="position:absolute; left:50%; top:50%; width:500px; height:200px; margin-top:-100px; margin-left:-266px; padding:15px; color:#666;">
        <h1><img src="../../images/ajax-loader.gif" /> Produktbladet laddas...</h1>
    </div>
    <input id="hiddenARIDENT" name="ARIDENT" type="hidden" value="124494" />
</body>
<script type="text/javascript">
    $(document).ready(function () {
        var url2 = "/ProductSheet/Details.ashx/" + $('#hiddenARIDENT').val()
        $.ajax({
            url: url2,
            cache: false,
            success: function (respones) {
                with (window.document) {
                    write(respones);
                    close();
                }
            }
        });
    });
</script>
</html>

在我看来,所有的信息都是从其他地方加载的。如果我按下f12,我可以看到我想要的所有信息,但我如何访问这些信息?这可能吗?

感谢您的帮助。

从使用Js呈现的站点获取html

原始页面只是用ajax加载实际内容,并用它替换文档内容。在这种情况下的实际信息可在/ProductSheet/Details.ashx/124494,(注意Details.ashx中的 s ,其中包含实际的页面内容。

一般来说,服务器可能会检查请求是否也包含X-Requested-With: XMLHttpRequest头,但这里似乎不是这样。