在.net中解析HTML的正则表达式

本文关键字:HTML 正则表达式 net | 更新日期: 2023-09-27 17:50:32

我试图使用正则表达式in来匹配文本文件中的以下内容,其中字符串中的orlst部分可能是任何字符a- z:

<frame src="orlst.html" name="list">

到目前为止,我只能使用(<frame src=)的模式来返回任何结果。但是它只返回匹配集合中的<frame src=

任何想法如何我可以添加到我的模式返回我正在寻找的?

在.net中解析HTML的正则表达式

这是你要找的吗?

(<frame src="[a-zA-Z]*.html" name="list">)

它匹配您的测试字符串和任何字符串,其中'orlist'部分是一系列字母。就像其他人评论的那样,最好使用HTML解析器。

尝试使用HTML敏捷包这里有一个使用正则表达式和图像的示例

        HtmlWeb web = new HtmlWeb();
        HtmlDocument doc = web.Load(link);
        doc.OptionUseIdAttribute = true;
        doc.OptionFixNestedTags = true;
        string Img=string.Empty ;
        if (doc.DocumentNode != null)
        {
            try {
                HtmlNode img3 = doc.DocumentNode.SelectSingleNode("//*[@class='"thumb'"]//img[@src]");
                Img = img3.Attributes["src"].Value;
            }
            catch {
                Img = "";
            };
        }