title of twitter.com

本文关键字:com twitter of title | 更新日期: 2023-09-27 18:16:06

WebClient x = new WebClient();
string source = x.DownloadString("http://www.facebook.com/");
string title = Regex.Match(source, @"'<title'b[^>]*'>'s*(?<Title>['s'S]*?)'</title'>", RegexOptions.IgnoreCase).Groups["Title"].Value;
Console.WriteLine(title);
Console.ReadLine();

我使用上面写的代码打印一个网站的标题。这种方法几乎适用于所有网站,除了twitter。谁能告诉我怎么才能从twitter.com获得正确的标题

title of twitter.com

你不应该使用正则表达式来解析(X)HTML。使用针对特定任务的工具,例如Html Agility Pack:

private static string GetPageTitle(string url)
{
    HtmlWeb web = new HtmlWeb();
    HtmlDocument doc = web.Load(url);
    var result = doc.DocumentNode
        .DescendantNodes()
        .FirstOrDefault(node =>
            string.Compare(
                node.Name,
                "title",
                StringComparison.InvariantCultureIgnoreCase) == 0);
    return result != null ? result.InnerHtml : string.Empty;
}