如何在获取页面时解决编码问题'；s的源代码

本文关键字：问题源代码编码解决获取 | 更新日期: 2023-09-27 18:01:12

我正在使用获取页面源代码

          Uri url = new Uri(urlAddress);
        WebClient client = new WebClient();
        client.Encoding = System.Text.Encoding.UTF8;
        string htlm = client.DownloadString(url);

但它在kickass.to(当前站点(上给出了字符问题，即使它写

     "meta http-equiv="Content-Type" content="text/html; charset=utf-8""

在源代码中。

也尝试过这种方法http://www.tech-recipes.com/rx/1954/get_web_page_contents_in_code_with_csharp/获取不起作用的源代码

示例源代码：http://pastebin.com/ycBjWLRi

如何正确获取源代码？

如何在获取页面时解决编码问题'；s的源代码

我在最近读过的一篇文章中注意到了一些关于强制字符编码的内容：

Html敏捷包-海量信息提取

它说你应该这样设置：

HtmlWeb htmlWeb = new HtmlWeb() { 
  AutoDetectEncoding = false, 
  OverrideEncoding = Encoding.GetEncoding("iso-8859-2") 
};

这是使用Html敏捷包，你已经用它标记了你的问题，但你似乎没有在上面的代码示例或你在tech-recipes.com上链接的文章中实际使用过它。