当使用c#对域进行网络爬网时,如何确定页面类型

本文关键字:何确定 类型 网络 | 更新日期: 2023-09-27 18:27:47

我想看看是否有一种具体的方法来确定主页url的页面类型或扩展名。例如,如果我对域(如www.example.com)进行web请求,那么它返回的页面是.PHP或.ASP扩展类型。我想尝试扫描一个范围内的所有域,只返回.asp经典页面和sat作为示例。

当使用c#对域进行网络爬网时,如何确定页面类型

一般来说,您无法确定服务器如何响应URL请求。假设您不能查看扩展(如您所描述的情况),那么响应标头可能会有所帮助。例如:

  1. 看看X-AspNet-Version。如果存在后者,则几乎可以肯定是IIS在运行ASP.NET。如果失败,请查看Server标头,它可能类似于"Microsoft IIS/8.0"
  2. 看看Access-Control-Allow-Methods。如果这一点不存在,或者在IIS上仅设置为GET和POST(请参阅上文),那么它很可能是经典的ASP或ASP.NET
  3. 一些网站可能包含专业标题。例如,博客网站可以包含报头X-Pingback,其可以指向具有扩展名的URL

另一种选择是使用白帽黑客工具。我知道nmap可以远程确定操作系统,但不一定是如何生成页面的。然而,未经网站事先许可,我不建议这样做,因为这可能被视为攻击。

让我退一步。为什么要确定它们是否正在运行ASP?如果您正在寻找漏洞,请将问题提交给安全论坛。如果你是一个控件编写者,想看看是否有人在盗版你的工具,那么在控件输出中嵌入一段不同的HTML,你可以扫描它。