为网址创建正则表达式,网址的数字在www.之后,邮件的数字在@之后
本文关键字:数字 之后 www 创建 正则表达式 | 更新日期: 2023-09-27 17:58:49
我不擅长regex,这就是为什么发布这篇文章的原因。我有代码可以从html获取所有的url和所有的电子邮件。但我需要以下内容。我可以使用以下内容获取所有URL:
Regex regx = new Regex("http://([''w+?''.''w+])+([a-zA-Z0-9''~''!''@''#''$''%''^''&''*''('')_''-''=''+''''''/''?''.'':'';''''',]*)?",
RegexOptions.IgnoreCase);
MatchCollection ms = regx.Matches(body);
foreach (Match m in ms)
{
string tmpLink = m.Value.ToString();
}
现在我想进一步匹配它是否包含www.之后的数字,所以我会将其标记为垃圾邮件。或者可以有一个完整的代码来代替这个内部循环。电子邮件也是如此,获取那些在@之后有编号的电子邮件。
您的正则表达式是这样工作的:http://([''w+?''.''w+])+([a-zA-Z0-9''~''!''@''#''$''%''^''&''*''('')_''-''=''+''''/''?''.'':'';''''',]*)?
http://
-http://
([''w+?''.''w+])+
-出现一次或多次的以下任何一种情况-字字符、+
、?
、.
(.
不需要转义)
([a-zA-Z0-9''~''!''@''#''$''%''^''&''*''('')_''-''=''+''''''/''?''.'':'';''''',]*)?
-可选部分,其中单词字符或列出的字符出现零次或多次(充满不需要的转义)
对于后面跟有www.
的http://
,使用http://www'.
,并且http://www'.'d+['w.]*
与后面跟有一个或多个数字的http://www.
匹配,后面跟有零或多个字字符或点。
对于数字在@
之后的电子邮件,请使用[A-Za-z]'w+'@'d+['w.]*
。
注意:我不确定你的要求。