正则表达式仅与HTTP匹配网站,而没有www
本文关键字:www 网站 HTTP 正则表达式 | 更新日期: 2023-09-27 18:34:27
我想从HTML代码中获取所有网站。问题是我有一个正则表达式,它接受所有 URL,但地址中需要www
。我需要使用哪种正则表达式来获取内容中没有www
的 URL?
更新:我正在使用的正则表达式是:
string anchorPattern =
@"(?<Protocol>'w+)://(?<Domain>['w@]['w.:@]+)/?['w.?=%&='-@/$,&+]*'";
添加 (?=www) 仅用于具有 www 的网址
@"(?<Protocol>'w+)://(?=www)(?<Domain>['w@]['w.:@]+)/?['w.?=%&='-@/$,&+]*"
或添加 (?!www) 表示没有 www 网址
@"(?<Protocol>'w+)://(?!www)(?<Domain>['w@]['w.:@]+)/?['w.?=%&='-@/$,&+]*"
像
你一样的一个,但没有看起来像www'.
的正则表达式部分