RegEx替换HTML注释更新停止
本文关键字:更新 注释 替换 HTML RegEx | 更新日期: 2023-09-27 18:19:19
我有一些mht格式的文件。在部分HTML中,我确实替换了正则表达式。
string reta = Regex.Replace(_file, @"'<![ 'r'n't]*(--([^'-]|['r'n]|-[^'-])*--[ 'r'n't]*)'>",
String.Empty, RegexOptions.Singleline | RegexOptions.Multiline |
RegexOptions.IgnorePatternWhitespace);
对于某些文件,这个替换永远不会停止。
也许你能看出这个替换有什么问题。为了保存数据,我没有添加这个文件。
谢谢
p。我尽量把这部分去掉。
回答
我在测试数据集中更改了查询REGEX是否工作。
<![ 'r'n't]*--.*?--[ 'r'n't]*>
每当有人提出关于正则表达式和html的问题时,我会说先看看这个答案:
RegEx匹配开放标签,除了XHTML自包含标签
你需要读一下