与 C# 中的字符串不匹配的正则表达式
本文关键字:不匹配 正则表达式 字符串 | 更新日期: 2023-09-27 18:36:40
我有一些HTML需要解析(在大型文档中)为文本,我感兴趣的部分如下所示:
...
<div id="whatever" class="whatever whatever">some title with <em>html</em> and other such tags in it, but never a div tag</div>
...
现在我想用 HTML 摆脱 DIV 中的文本。以下是我对正则表达式(使用组)的内容:
<div id='"whatever'" class='"whatever whatever'">(?<title>[^</div>]*?)</div>
所以那里的想法是,我将匹配整个事情,并获得一个包含所有文本的组,直到出现
[] 中的 ^ 不起作用,因为它是这些字符的"任意",而不是我想要的字符串"。任何想法我如何使这项工作?
Match m=Regex.Match(s,"''<div id='"whatever'" class='"whatever whatever'">(.*?)''<''/div''>");
Console.WriteLine(m.Groups[1].Value);