Regex:如何指定一个十六进制范围,覆盖Unicode符号的集合
本文关键字:覆盖 范围 Unicode 符号 集合 十六进制 一个 何指定 Regex | 更新日期: 2023-09-27 18:16:36
我有一个包含无效字符(十六进制:0x2642)的XML文档。下面是更多内容。我想在反序列化文件之前删除它。当我们去掉无效字符时,XML表示为字符串。到目前为止,我们已经使用了:
var xmlString = Regex.Replace(xmlString, @"[^'u0000-'uF000]", string.Empty);
它适用于控制字符,但不是指定0x2642,我想在regex中创建一个范围,该范围涵盖了一系列符号,以避免将来出现此问题(特别是这里的这些符号)
指定MiscellaneousSymbols块的链接符号你可以使用正则表达式:
'p{IsMiscellaneousSymbols}
在c#中匹配它们。
c#使用
'p{IsBlock}
作为Unicode块