RegEx替换HTML注释更新停止

本文关键字:更新 注释 替换 HTML RegEx | 更新日期: 2023-09-27 18:19:19

我有一些mht格式的文件。在部分HTML中,我确实替换了正则表达式。

string reta = Regex.Replace(_file, @"'<![ 'r'n't]*(--([^'-]|['r'n]|-[^'-])*--[ 'r'n't]*)'>",
                            String.Empty, RegexOptions.Singleline | RegexOptions.Multiline |
                            RegexOptions.IgnorePatternWhitespace);

对于某些文件,这个替换永远不会停止。
也许你能看出这个替换有什么问题。为了保存数据,我没有添加这个文件。

谢谢

p。我尽量把这部分去掉。

回答
我在测试数据集中更改了查询REGEX是否工作。

<![ 'r'n't]*--.*?--[ 'r'n't]*>

RegEx替换HTML注释更新停止

每当有人提出关于正则表达式和html的问题时,我会说先看看这个答案:

RegEx匹配开放标签,除了XHTML自包含标签

你需要读一下