抓取网站,代理功能问题

本文关键字:功能 问题 代理 网站 抓取 | 更新日期: 2023-09-27 18:08:20

我正在爬一个教育网站。我想插入大学和课程详细信息

链接到下一页:

<a onclick="SetCourseID('20232')">PGDCA</a>

这个javascript函数发送AJAX请求到:

url/ajax.php?CourseID=20232

设置CourseId Session并重定向到页面:

url/CollegeName

课程将根据存储在会话中的CourseID加载如何从C# code设置ajax.php中的Session .

或者How can i solve this problem ??如何调用javascript函数形式的服务器??

抓取网站,代理功能问题

你不能在c#中为PHP设置会话。您提到的URL看起来像是PHP通过URL获取信息,而不是会话或cookie集。这是件好事。

设置爬虫解析所有url以获取课程ID

然后让爬虫爬/url/ajax.php?Courseid ={插入您解析出的id}

然后保存第二次抓取的结果集

客户端

<script type="text/javascript">
    function yourFunction() {
        alert("hi");
    }
</script>

服务器端(你可以像这样从服务器端调用这个客户端函数)

Page.ClientScript.RegisterStartupScript(this.GetType(), "myScript", "yourFunction();", true);