.net中的正则表达式,以获得一个特殊的标记
本文关键字:一个 正则表达式 net | 更新日期: 2023-09-27 18:06:06
示例html代码如下:
<div><span>span1</span></div>
<b>for test</b>
<span>span2</span>
是否有办法获得所有不在div标签中的span标签(在本例中:span2)
根据这篇文章c#正则表达式排除字符串这是我的模式,但它不起作用。样式:((?:(?!'b<div>'b))*)((.|'n)*?)<span>((.|'n)*?)</span>((.|'n)*?)((?:(?!'b</div>'b))*)
您确实不希望使用正则表达式来尝试解析HTML。你可以阅读更多关于Stack Overflow问题的原因:RegEx匹配开放标签,除了XHTML自包含标签
您应该使用HTML解析器,如HTML Agility Pack,或者甚至是简单的XML解析器,如XMLReader