c中的regex来提取page.com/users/(this)/xxxxxx/

本文关键字:users xxxxxx this com regex 中的 提取 page | 更新日期: 2023-09-27 18:00:27

在过去的两个小时里,我一直试图解决这个问题,但它根本不起作用:(

我已经下载了一个网页的html代码,然后我删除了所有的双空格和所有的新行,所以整个代码是一行字符串。

然后我必须从中提取一段数据

page.com/users/(this)/xxxxxx/….

match = Regex.Match(htmlCode, "page.com/users/(.*)/xxxxx/");
string user = match.Groups[1].ToString();

但它不起作用,我总是得到(this)/xxxxxx/+其余的html代码。

有人知道为什么不起作用吗?

c中的regex来提取page.com/users/(this)/xxxxxx/

使用([^/]*)而不是贪婪的(.*)

您的.*正在匹配之后的所有内容,包括/xxxxx/部分。

指定.*更具体地说,就像[^/]+,意味着那里必须有一些东西,它可以是除/

之外的任何东西

尝试

match = Regex.Match(htmlCode, "page.com/users/([^/]*)/xxxxx/");
string user = match.Groups[1].ToString();

尝试page.com/users/([^/]*)/xxxxx/