正则表达式仅与HTTP匹配网站,而没有www

本文关键字:www 网站 HTTP 正则表达式 | 更新日期: 2023-09-27 18:34:27

我想从HTML代码中获取所有网站。问题是我有一个正则表达式,它接受所有 URL,但地址中需要www。我需要使用哪种正则表达式来获取内容中没有www的 URL?

更新:我正在使用的正则表达式是:

string anchorPattern = 
  @"(?<Protocol>'w+)://(?<Domain>['w@]['w.:@]+)/?['w.?=%&='-@/$,&amp;+]*'";

正则表达式仅与HTTP匹配网站,而没有www

添加 (?=www) 仅用于具有 www 的网址

@"(?<Protocol>'w+)://(?=www)(?<Domain>['w@]['w.:@]+)/?['w.?=%&='-@/$,&amp;+]*"

或添加 (?!www) 表示没有 www 网址

@"(?<Protocol>'w+)://(?!www)(?<Domain>['w@]['w.:@]+)/?['w.?=%&='-@/$,&amp;+]*"

你一样的一个,但没有看起来像www'.的正则表达式部分