源代码包含无效字符
本文关键字:字符 无效 包含 源代码 | 更新日期: 2024-10-30 04:19:47
下面是一些代码,它应该只返回页面的源代码。然而,这个页面的源代码不断返回,有织带和无效字符(数百个)。我尝试了各种标题描述,但没有一个可以解决问题。'
string url2 = "http://mcassessor.maricopa.gov/?s=176-09-419"
HttpWebRequest request2 = (HttpWebRequest)WebRequest.Create(url2);
request2.CookieContainer = cookieJar;
request2.Method = "GET";
request2.Accept = "text/html, application/xhtml+xml, */*";
request2.Headers.Add("Accept-Language: en-US,en;q=0.5");
request2.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; MAM3; rv:11.0) like Gecko";
request2.Headers.Add("Accept-Encoding: gzip, deflate");
request2.Headers.Add("X-UA-Compatible: IE=edge,chrome=1");
using (HttpWebResponse response2 = (HttpWebResponse)request2.GetResponse())
{
string sourceCode2 = new StreamReader(request2.GetResponse().GetResponseStream()).ReadToEnd();
}
这是因为它回来了 gzipped.. 你告诉它在这里压缩:
request2.Headers.Add("Accept-Encoding: gzip, deflate");
您可以删除它..或者告诉请求解压缩它:
request2.AutomaticDecompression = DecompressionMethods.GZip;