c#在网站中搜索字符串

本文关键字:搜索 字符串 网站 | 更新日期: 2023-09-27 18:11:07

我想弄清楚如果在c#中,如果我已经将网页内容转换为字符串,什么是搜索扩展的最佳方法。我只是想提取网址内的网页,以。html或。xhtml或edu结束。我不关心开头是什么样子,用EndWith还是Regex找到这个更好。

所以如果我的输入是这样的

字符串str = {var a, b = window.location.href.match (//webhp ' ? [^ #] 调整= (^ #)/);如果(= b&, b.length> 0 ?"http://www.google.com/logos/2011/lespaul.html"+ b [

我想取出http://www.google.com/logos/2011/lespaul.html将其存储到数组

c#在网站中搜索字符串

你应该使用HTML解析器,如sharp-query或HTML Agility Pack,永远不要使用正则表达式来解析HTML,或者正如这篇文章的作者所说的一些事情可能发生

我可以想出这个正则表达式:http:'/'/(.*?)(.html|.xhtml|.edu)
编辑感谢@Kakashi http:'/'/.*?'.(?:x?html|edu)

试试这个:

var input = "string str = {var a,b=window.location.href.match(//webhp''?[^#]tune=[^#]/);if(a=b&&b.length>0?'"http://www.google.com/logos/2011/lespaul.html";
var match =  Regex.Match(input, @"https?:'/{2}[^'n]+'.(?:x?html|edu)");
Console.Write(match.Success? match.Groups[0].Value : "Not found"); //http://www.google.com/logos/2011/lespaul.html