与 C# 中的字符串不匹配的正则表达式

本文关键字:不匹配 正则表达式 字符串 | 更新日期: 2023-09-27 18:36:40

我有一些HTML需要解析(在大型文档中)为文本,我感兴趣的部分如下所示:

...
<div id="whatever" class="whatever whatever">some title with <em>html</em> and other such tags in it, but never a div tag</div>
...

现在我想用 HTML 摆脱 DIV 中的文本。以下是我对正则表达式(使用组)的内容:

<div id='"whatever'" class='"whatever whatever'">(?<title>[^</div>]*?)</div>

所以那里的想法是,我将匹配整个事情,并获得一个包含所有文本的组,直到出现

与 C# 中的字符串不匹配的正则表达式

的位置(因为字符串末尾没有其他识别因素)。

[] 中的 ^ 不起作用,因为它是这些字符的"任意",而不是我想要的字符串"。任何想法我如何使这项工作?

Match m=Regex.Match(s,"''<div id='"whatever'" class='"whatever whatever'">(.*?)''<''/div''>");                                                       
Console.WriteLine(m.Groups[1].Value);