把“,撕咬;““,ouml;“到它的正常表示
本文关键字:常表示 表示 撕咬 ouml | 更新日期: 2023-09-27 18:04:00
我正在加载一个网页System.Net.WebClient
。页面是ISO-8859-1
编码。如果我把它写入文件,然后打开,我可以正常看到所有的字符。
但是如果我把这个内容放入htmllagilitypack然后提取innerText属性,我得到一些特殊的字母编码为å
和ö
。
如何将它们转换为正常表示?
使用HttpUtility.HtmlDecode
方法
HttpUtility.HtmlDecode("å"); // å
您可以使用文本字符串作为参数调用HtmlEntity.DeEntitize
方法。