在.net中解析HTML的正则表达式
本文关键字:HTML 正则表达式 net | 更新日期: 2023-09-27 17:50:32
我试图使用正则表达式in来匹配文本文件中的以下内容,其中字符串中的orlst
部分可能是任何字符a- z:
<frame src="orlst.html" name="list">
到目前为止,我只能使用(<frame src=)
的模式来返回任何结果。但是它只返回匹配集合中的<frame src=
。
任何想法如何我可以添加到我的模式返回我正在寻找的?
这是你要找的吗?
(<frame src="[a-zA-Z]*.html" name="list">)
它匹配您的测试字符串和任何字符串,其中'orlist'部分是一系列字母。就像其他人评论的那样,最好使用HTML解析器。
尝试使用HTML敏捷包这里有一个使用正则表达式和图像的示例
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(link);
doc.OptionUseIdAttribute = true;
doc.OptionFixNestedTags = true;
string Img=string.Empty ;
if (doc.DocumentNode != null)
{
try {
HtmlNode img3 = doc.DocumentNode.SelectSingleNode("//*[@class='"thumb'"]//img[@src]");
Img = img3.Attributes["src"].Value;
}
catch {
Img = "";
};
}