响应HttpWebRequest的内容编码问题

本文关键字:编码 问题 HttpWebRequest 响应 | 更新日期: 2023-09-27 17:57:34

我使用HttpWebRequest读取网页,使用以下代码:

 var pageurl = new Uri(url, UriKind.Absolute);
        var request = (HttpWebRequest)WebRequest.Create(pageurl);
        request.Method = "GET";
        request.AutomaticDecompression = DecompressionMethods.GZip;
        request.KeepAlive = false;
        request.ConnectionGroupName = Guid.NewGuid().ToString();
        request.ServicePoint.Expect100Continue = false;
        request.Pipelined = false;
        request.MaximumResponseHeadersLength = 4;
        if (ignoreCertificateErrors)
        {
            ServicePointManager.ServerCertificateValidationCallback += AcceptAllCertificatePolicy;
        }
        var response = (HttpWebResponse)request.GetResponse();

    if (response != null)
        {
            using (var reader = new StreamReader(response.GetResponseStream()))
            {
                return reader.ReadToEnd();
            }
        }

当通过的语言是英语时,这非常有效,但当另一种语言如西班牙语时,我会获得大量�在返回的内容中。

代码有问题吗?或者我缺少一些编码方面的东西吗?

响应HttpWebRequest的内容编码问题

您必须为要下载到StreamReader的页面指定正确的编码。例如,如果页面的编码为ISO-8859-2,请使用

new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("ISO-8859-2"))