从文件中提取文本c#
本文关键字:取文本 提取 文件 | 更新日期: 2023-09-27 18:14:47
我得到一个。mail文件,其中包含:
FromFild=xxx@gmail.com
ToFild=yyy@gmai.com
SubjectFild=Test
Message=
<b><font size="3" color="blue">testing</font> </b>
<table>
<tr>
<th>Question</th>
<th>Answer</th>
<th>Correct?</th>
</tr>
<tr>
<td>What is the capital of Burundi?</td>
<td>Bujumburra</td>
<td>Yes</td>
</tr>
<tr>
<td>What is the capital of France?</td>
<td>F</td>
<td>Erm... sort of</td>
</tr>
</table>
Message=END
#at least one empty line needed at the end!
和我需要提取和保存只有消息=和消息=END之间的文本。我尝试了split('='). last/First()。不好的。我不能使用Substring,因为它只接受int ofIndex。我是个新手,想不出解决办法。你能给个提示吗?
你可以使用这个正则表达式:
/Message=(?<messagebody>(.*))Message=END/s
然后获取消息的代码:
string fileContent; //The content of your .mail file
MatchCollection match = Regex.Matches(fileContent, "/Message=(?<messagebody>(.*))Message=END/s");
string message = match[0].Groups["messagebody"].Value;
我将假设在文本文件或您正在寻找的消息中没有固定数量的行,我可以依赖。
string prefix = "Message=";
string postfix = "Message=END";
var text = File.ReadAllText("a.txt");
var messageStart = text.IndexOf(prefix) + prefix.Length;
var messageStop = text.IndexOf(postfix);
var result = text.Substring(messageStart, messageStop - messageStart);