把“,撕咬;““,ouml;“到它的正常表示

本文关键字:常表示 表示 撕咬 ouml | 更新日期: 2023-09-27 18:04:00

我正在加载一个网页System.Net.WebClient。页面是ISO-8859-1编码。如果我把它写入文件,然后打开,我可以正常看到所有的字符。

但是如果我把这个内容放入htmllagilitypack然后提取innerText属性,我得到一些特殊的字母编码为åö

如何将它们转换为正常表示?

把“,撕咬;““,ouml;“到它的正常表示

使用HttpUtility.HtmlDecode方法

HttpUtility.HtmlDecode("å"); // å

您可以使用文本字符串作为参数调用HtmlEntity.DeEntitize方法。