如何使用RegEx替换字符串中所有不需要的字符
本文关键字:不需要 字符 何使用 RegEx 替换 字符串 | 更新日期: 2023-09-27 18:00:35
在c#应用程序中,我需要用"â"替换所有不需要的字符。以下是允许的字符数组。
string[] wantedCharacters = new string[] { " ", "!", "'"", "#", "$", "%", "&", "''", "(", ")", "*", "+", ",", "-", ".", "/", "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", ":", ";", "<", "=", ">", "?", "@", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", "[", "''", "]", "^", "_", "`", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "{", "|", "}", "~" };
除此之外的所有字符都应使用"替换。我已经用Loopin完成了所有的字符串。但执行起来花费了太多时间。我正在寻找一个正则表达式来执行此操作。任何帮助都将不胜感激。
[^c]
的意思是:不是c
的一切。您应该用您允许的字符替换c
,并使用该正则表达式替换方法:
var reg = new Regex(@"[^ !""#$%&'()*+,-./0-9:;<=>?@A-Z'[''']^_`a-z{|}~]");
var result = reg.Replace(inputString, "Ã");
我不会使用RegEx,它的可读性会降低。
string input "..";
HashSet<char> wantedCharactersSet = new HashSet<char>(wantedCharacters);
for (int i = 0; i < input.Length; i++)
{
if (!wantedCharactersSet.Contains(input[i]))
input[i] = placeholderChar;
}
注意,HashSet<T>.Contains()
的性能为O(1),而Array只有n。
您似乎试图将字符限制为ASCII中的可打印字符(代码为0x20到0x7E的字符)。所以你可以使用这个正则表达式:
[^'x20-'x7E]
正则表达式将匹配所有不需要的字符。
将上面的正则表达式放在文字字符串中:
@"[^'x20-'x7E]"
将此正则表达式与Replace
函数一起使用,并替换为空字符串以删除所有不需要的字符,或替换为您选择的某个占位符字符。