正在使用RegEx分析电影标题
本文关键字:电影 标题 RegEx | 更新日期: 2023-09-27 18:29:46
如果可以在一个RegularExpression 中提取电影标题,我有3个字符串
<title>Airplane! (1980)</title>
<title>"24" (2001)</title>
<title>"Agents of S.H.I.E.L.D." The Magical Place (2014)</title>
到目前为止,我最好的机会是这个:
<title>(")?(.*?)(")?.*?'(('d{4})').*?</title>
适用于《神盾局特工》和《24小时》,但不适用于《飞机!》。
我做错了什么?
尽管可能不清楚正则表达式是在C#程序中调用的,而且我使用的是RegEx
RE用于行开始=>打开标签=>可选"
=>读取直到"
或(nnnn)
titles = System.Net.WebUtility.HtmlDecode(titles);
foreach (Match match in Regex.Matches(titles,
@"^'s*<title>'s*'""*(.*?)('""|'('d{4}'))", RegexOptions.Multiline | RegexOptions.IgnoreCase))
{
if (match.Success)
{
string name = match.Groups[1].Value;
}
}