使用正则表达式删除字符串的一部分
本文关键字:一部分 字符串 删除 正则表达式 | 更新日期: 2023-09-27 18:29:52
我在C#中有一个RSS阅读器,我的问题是有些网站也在它们的提要中显示图片,但我不需要它。这就是这个网站的新闻描述现在的样子:
/calcio/calciomercato/2013/09/01-271389/Calciomercato?rssimage This is the actual news...
/calcio/calciomercato/2013/08/01-271389/Notizia?rssimage This is the real news...
/calcio/calciomercato/2013/05/01-271389/Esempio?rssimage The news...
如何删除实际新闻之前的所有文本?所有"不需要的部分"都以"?rssimage"结尾,那么我如何删除之前的所有文本?此外,我如何检查新闻是否包含这种不需要的文本?
谢谢!
编辑:这是RSS:http://tuttosport.feedsportal.com/c/34178/f/619230/index.rss
这是设计的输出:Gli emiliani vogliono un attachante:il sogno resta Belfodil,un’potesi concretaèFloro Flores,ma c’èanche il cileno dell‘Universidad
我是一个大公司:在极端情况下,Sartori dovrebbe poi trovare il sostituto properio
L’attachant finoraèstato poco impiegato tra i titolari,potrebbe and are a fare esprienza:我向博洛尼亚提出了一个临时
尝试:
string input = "/calcio/calciomercato/2013/09/01-271389/Calciomercato?rssimage This is the actual news...";
string output = Regex.Replace(input, @"(.*?)'?rssimage ", string.Empty);
不要忘记在代码文件的顶部添加using System.Text.RegularExpressions;
。
这很简单,我们不需要Regex
,只需要一些string methods
:
int i = line.IndexOf("?rssimage");
if(i != -1) line = line.Substring(i+8).TrimStart();