从网址获取 HTML
本文关键字:HTML 获取 | 更新日期: 2023-09-27 18:37:16
我正在尝试使用C#的HttpWebRequest来获取基于url的页面源代码。
在浏览器中,我这样做:
- 我去 http://brokercheck.finra.org/Search/Search.aspx
- 插入一个邮政编码,比如00501。 并执行搜索。
然后我被重定向到http://brokercheck.finra.org/Search/SearchResults.aspx?SearchGroup=Individual&IndlText=&FirmText=&ZipCode=00544&ZipRadius=5&PageNumber=1这个页面的html是我想要的。
使用 HttpWebRequest 的 get 方法的简单方法不起作用。它只会获取搜索页面的html。
然后,我尝试发送帖子并获取cookie,并使用cookie发送获取请求。但是,响应 html 仍然是搜索页面的 html。
使用 http
嗅探器工具(WireShark 或 HttpWatch)通过 Web 浏览器捕获 http 请求和响应。
搜索.aspx页面使用 : onclick="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions("ctl00$phContent$ucUnifiedSearch$lbtnFreeFormSearch", ", true, ", ", false, false))" 提交请求。
SearchResults.aspx 页面可能会使用一些请求标头信息(例如 previos 页面)来确定它是否是直接访问。
您需要在搜索结果.aspx请求中找出确切的数据。