如何将一系列unicode字符转换为可读的文本

本文关键字:文本 转换 字符 一系列 unicode | 更新日期: 2023-09-27 18:17:37

这里是一个示例输入:"''u0434''u0430''u043C''u043E",我想将其转换为可读的文本。如果它还能有重音字符,我会很感激。输入实际上可以比这个长,但这可以作为一个样本。

是的,我看到(http://www.joelonsoftware.com/articles/Unicode.html)和(如何打印/存储非ascii字符(unicode?)),但它没有回答我的问题,所以请不要将此标记为重复。我将感激得到一个示例代码在c#。我也尝试过HttpUtility.HtmlDecode(),但它实际上并没有解码它。下面是代码:

//this is coming from service call and its comming just like this.
var str="''u0434''u0430''u043C''u043E"; 
var decoded = HttpUtility.HtmlDecode(str); // this doesn't work. Its returning the string str as is.

作为旁注:下面将工作。但是我的输入不是那样的。

//Although my input isn't in the following form, the following works. But my input isn't in this form.
var str2="'u0434'u0430'u043C'u043E";
var decoded = HttpUtility.HtmlDecode(str2);

如何正确解码像"'u0434'u0430'u043C'u043E"这样的字符串为可读文本。

如何将一系列unicode字符转换为可读的文本

我终于把它修好了:

我得到了它的工作通过使用Regex.Unscape()方法。如果其他人遇到同样的问题,解决方法如下:

  var str = "''u0434''u0430''u043C''u043E";
  var decoded = HttpUtility.HtmlDecode(Regex.Unescape(str)); //take a look the Regex.Unscape() call.