正在使用RegEx分析电影标题

本文关键字:电影 标题 RegEx | 更新日期: 2023-09-27 18:29:46

如果可以在一个RegularExpression 中提取电影标题,我有3个字符串

<title>Airplane! (1980)</title>    
<title>&#x22;24&#x22; (2001)</title>    
<title>&#x22;Agents of S.H.I.E.L.D.&#x22; The Magical Place (2014)</title>

到目前为止,我最好的机会是这个:

<title>(&#x22;)?(.*?)(&#x22;)?.*?'(('d{4})').*?</title>

适用于《神盾局特工》和《24小时》,但不适用于《飞机!》。

我做错了什么?

尽管可能不清楚正则表达式是在C#程序中调用的,而且我使用的是RegEx

正在使用RegEx分析电影标题

RE用于行开始=>打开标签=>可选"=>读取直到"(nnnn)

titles = System.Net.WebUtility.HtmlDecode(titles);
foreach (Match match in Regex.Matches(titles, 
         @"^'s*<title>'s*'""*(.*?)('""|'('d{4}'))", RegexOptions.Multiline | RegexOptions.IgnoreCase))
{
    if (match.Success)
    {
        string name = match.Groups[1].Value;
    }
}