当在c#中发现结束标签时,删除html标签并拆分它
本文关键字:标签 删除 html 拆分 发现 结束 当在 | 更新日期: 2023-09-27 18:05:45
我想从下面的字符串中删除所有html标签,并分割它,而不使用句号(句号)作为匹配字符。下面的字符串是动态的,在列表标签
中可以有更多的条件<li>This Offer cannot be redeemed with any other offer.</li><li>Only one Offer can be used at a time.</li><li>This Offer is not transferable.</li><li>......</li><li>....</li</ul></div>
I'm expected the result
- 此优惠不能与任何其他优惠兑换。
- 一次只能使用一个Offer。
- 此优惠不可转让。
- …
- …
String[] myString = yourString.replace("<li>", "").Split(new string[] { "</li>" }, StringSplitOptions.RemoveEmptyEntries);
试试这个
const string HTML_TAG_PATTERN = "<[^/li]>"; // may require some change
string safeString = Regex.Replace(yourString, HTML_TAG_PATTERN, string.Empty);
String[] myString = safeString.Split(new string[] { "</li>" }, StringSplitOptions.RemoveEmptyEntries);
你也可以试试这个正则表达式
string acceptable = "li";
string stringPattern = @"</?(?(?=" + acceptable + @")notag|[a-zA-Z0-9]+)(?:'s[a-zA-Z0-9'-]+=?(?:(["",']?).*?'1?)?)*'s*/?>";
string yourString= Regex.Replace(yourString, stringPattern, string.Empty);
String[] myString = yourString.replace("<li>", "").Split(new string[] { "</li>" }, StringSplitOptions.RemoveEmptyEntries);
你可以删除所有的HTML标签和分割下面的代码
string HTML_TAG_PATTERN = "<.*?>";
string str = @"<li>This Offer cannot be redeemed with any other offer.</li><li>Only one Offer can be used at a time.</li><li>This Offer is not transferable.</li><li>......</li><li>....</li</ul></div>";
string[] stString = Regex.Replace(str.Replace("</li>", "#$#"), HTML_TAG_PATTERN, string.Empty).Split("#$#".ToCharArray(), StringSplitOptions.RemoveEmptyEntries);
如果您能够给您的<li>
id,那么,你可以尝试用javascript代码写如下>>
var str=doccument.getElementById("liID").innerHTML;
这个东西你可以在windows的onload事件或任何特定的根据你的应用。