如何使用Regex拆分字符串.拆分并保留所有分隔符

本文关键字:拆分 分隔符 保留 字符串 何使用 Regex | 更新日期: 2023-09-27 18:15:43

如何使用Regex拆分字符串。拆分并保留所有分隔符?

我有一个字符串:"substring1-delimeter1-substring2",其中delimeter+substring2是地址的一部分。

此外,我有两个或两个以上的delimeter:delim1,delim2在含义上是等价的;

我想得到这样的字符串数组:

arr[0]="subsctring1";
arr[1]="delim1 subsctring2";

或者,

arr[1]="delim2 subsctring2;

我有一个模式:

addrArr= Regex.Split(inputText, String.Concat("(?<=",delimeter1, "|",delimeter2, ")"), RegexOptions.None);

但效果并不好。

你能帮我创建一个有效的模式吗?

如何使用Regex拆分字符串.拆分并保留所有分隔符

您需要一个仅具有前瞻性的模式:

's+(?=delim1|delim2)

's+将匹配1个或多个空格(因为您的字符串包含空格(。如果没有空格,请使用's*(但随后需要从结果中删除空条目(。请参阅regex演示。如果这些分隔符必须是完整的单词,请使用'b单词边界:'s+(?='b(?:delim1|delim2)'b)

在C#中:

addrArr = Regex.Split(inputText, string.Format(@"'s+(?={0})", string.Join("|", delimeters)));

如果分隔符可以包含特殊的regex元字符,则需要在delimiters列表上运行Regex.Escape

C#演示:

var inputText = "substring1 delim1 substring2 delim2 substr3";
var  delimeters = new List<string> { "delim1", "delim2" };
var addrArr = Regex.Split(inputText, 
        string.Format(@"'s+(?={0})", string.Join("|", delimeters.Select(Regex.Escape))));
Console.WriteLine(string.Join("'n", addrArr));

我认为您需要使用先行检查,而不是后备检查,这样才能工作(不过还没有尝试过(。

此外,您必须小心分离器;它们必须进行转义,才能作为正则表达式中的模式正常工作。

试试这个:

addrArr= Regex.Split(inputText, string.Format("(?={0}|{1})", Regex.Escape(delimeter1), Regex.Escape(delimeter2)), RegexOptions.None);