Regex:如何指定一个十六进制范围,覆盖Unicode符号的集合

本文关键字:覆盖 范围 Unicode 符号 集合 十六进制 一个 何指定 Regex | 更新日期: 2023-09-27 18:16:36

我有一个包含无效字符(十六进制:0x2642)的XML文档。下面是更多内容。我想在反序列化文件之前删除它。当我们去掉无效字符时,XML表示为字符串。到目前为止,我们已经使用了:

var xmlString = Regex.Replace(xmlString, @"[^'u0000-'uF000]", string.Empty);

它适用于控制字符,但不是指定0x2642,我想在regex中创建一个范围,该范围涵盖了一系列符号,以避免将来出现此问题(特别是这里的这些符号)

Regex:如何指定一个十六进制范围,覆盖Unicode符号的集合

指定MiscellaneousSymbols块的链接符号你可以使用正则表达式:

'p{IsMiscellaneousSymbols}

在c#中匹配它们。


c#使用'p{IsBlock}作为Unicode块