HTML标记的正则表达式

本文关键字:正则表达式 HTML | 更新日期: 2023-09-27 18:22:11

我正试图找到一个正则表达式,它将匹配文本文件中的打开和关闭HTML标记。任何帮助都会很好,我所能想到的就是<[^>]*>,这是我最推荐的正则表达式。我应该提到,我正在使用VS 2010和C#。

HTML标记的正则表达式

认为您想要以下内容。这包括用于自动关闭标签和关闭标签的选项

"</?[a-zA-z]* ?/?>"

AFAIK使用正则表达式无法找到嵌套的html标记。例如,如果输入类似于<b>some phrase <b>double bolded</b> another phrase</b>,则不可能将正确的开始和结束标记与正则表达式相匹配。如果嵌套级别是固定的和已知的,这是可能的,但由于HTML中不是这样,regex将不起作用。