抓取网站,代理功能问题
本文关键字:功能 问题 代理 网站 抓取 | 更新日期: 2023-09-27 18:08:20
我正在爬一个教育网站。我想插入大学和课程详细信息
链接到下一页:
<a onclick="SetCourseID('20232')">PGDCA</a>
这个javascript函数发送AJAX请求到:
url/ajax.php?CourseID=20232
设置CourseId Session
并重定向到页面:
url/CollegeName
课程将根据存储在会话中的CourseID加载如何从C# code
设置ajax.php
中的Session .
或者How can i solve this problem ??如何调用javascript函数形式的服务器??
你不能在c#中为PHP设置会话。您提到的URL看起来像是PHP通过URL获取信息,而不是会话或cookie集。这是件好事。
设置爬虫解析所有url以获取课程ID
然后让爬虫爬/url/ajax.php?Courseid ={插入您解析出的id}
然后保存第二次抓取的结果集
客户端
<script type="text/javascript">
function yourFunction() {
alert("hi");
}
</script>
服务器端(你可以像这样从服务器端调用这个客户端函数)
Page.ClientScript.RegisterStartupScript(this.GetType(), "myScript", "yourFunction();", true);