网页抓取 - 如何阅读基于 swf 的网站内容

本文关键字:swf 网站 抓取 何阅读 网页 | 更新日期: 2023-09-27 18:34:35

要读取我使用WebClient的html网站的内容:

WebClient client = new WebClient();
byte[] html      = client.DownloadData(url);
UTF8Encoding utf = new UTF8Encoding();
return utf.GetString(html);

网站像 www.bet365.com 时的问题。赔率以swf显示。如何读取赔率?我无法通过 Ctrl+U 或 Firebug 在 Mozilla 中事件显示网站的内容。在IE(F12(中检查工作。

谢谢

网页抓取 - 如何阅读基于 swf 的网站内容

据我所知,您无法抓取Flash内容。

但是,您可以做的是尝试使用代理工具(例如Fiddler或Wireshark(嗅探.swf发起的HTTP流量,并祈祷它没有加密。

通过分析这些HTTP请求,您将能够提取检索数据的请求并使用WebClientHttpWebRequest自动执行它们。

但是,在自动提取数据之前,请确保它是允许的,并且您没有违反任何网站条款和条件。

他们有一个XML提要,他们提供给附属公司,没有人在抓取他们的实际网站