如何使用RegEx替换字符串中所有不需要的字符

本文关键字:不需要 字符 何使用 RegEx 替换 字符串 | 更新日期: 2023-09-27 18:00:35

在c#应用程序中,我需要用"â"替换所有不需要的字符。以下是允许的字符数组。

string[] wantedCharacters = new string[] { " ", "!", "'"", "#", "$", "%", "&", "''", "(", ")", "*", "+", ",", "-", ".", "/", "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", ":", ";", "<", "=", ">", "?", "@", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", "[", "''", "]", "^", "_", "`", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "{", "|", "}", "~" };

除此之外的所有字符都应使用"替换。我已经用Loopin完成了所有的字符串。但执行起来花费了太多时间。我正在寻找一个正则表达式来执行此操作。任何帮助都将不胜感激。

如何使用RegEx替换字符串中所有不需要的字符

[^c]的意思是:不是c的一切。您应该用您允许的字符替换c,并使用该正则表达式替换方法:

var reg = new Regex(@"[^ !""#$%&'()*+,-./0-9:;<=>?@A-Z'[''']^_`a-z{|}~]");
var result = reg.Replace(inputString, "Ã");

我不会使用RegEx,它的可读性会降低。

string input "..";
HashSet<char> wantedCharactersSet = new HashSet<char>(wantedCharacters);
for (int i = 0; i < input.Length; i++)
{
    if (!wantedCharactersSet.Contains(input[i]))
        input[i] = placeholderChar;
}

注意,HashSet<T>.Contains()的性能为O(1),而Array只有n。

您似乎试图将字符限制为ASCII中的可打印字符(代码为0x20到0x7E的字符)。所以你可以使用这个正则表达式:

[^'x20-'x7E]

正则表达式将匹配所有不需要的字符。

将上面的正则表达式放在文字字符串中:

@"[^'x20-'x7E]"

将此正则表达式与Replace函数一起使用,并替换为空字符串以删除所有不需要的字符,或替换为您选择的某个占位符字符。