需要一个正则表达式来消除<和祝辞
本文关键字:正则表达式 一个 | 更新日期: 2023-09-27 18:19:25
我需要一个c# RegEx模式,可以删除<
和>
之间的任何内容
E。G如果我的字符串是
<Html> some stuff here 123445!@#$% </HTML>
那么RegEx应该只返回
这里有些东西123445!@ # $ %
应删除<
和>
之间的任何内容,然后还要删除"<","> "
here is a working example :
string plainText = Regex.Replace(htmlText, "<[^>]+?>", "");
http://regexr.com?2vl05编辑
我是口译员:
< = search '<' char
[^>] =现在继续搜索字符不是>的
+继续查找更多的实例
?但不要贪心
>当我说不要贪婪-我的意思是-直到我遇到'>'
和替换这个"
类似:'<.+'>?(.*)'<'/.+'>?
第一组将是两个标签
你也可以在'<'/?.+'>
上做一个regex替换,你应该用什么来替换这个模式
在HTML中使用Regex可能有点危险,HTML不是一个规则语法,Regex可能在一些不太容易实现的情况下失败。如果你正在使用HTML和。net,也许你想看看HTML敏捷包