从文件中提取文本c#

本文关键字:取文本 提取 文件 | 更新日期: 2023-09-27 18:14:47

我得到一个。mail文件,其中包含:

FromFild=xxx@gmail.com
ToFild=yyy@gmai.com
SubjectFild=Test
Message=
<b><font size="3" color="blue">testing</font> </b>
<table>
<tr>
    <th>Question</th>
    <th>Answer</th>
    <th>Correct?</th>
</tr>
<tr>
    <td>What is the capital of Burundi?</td>
    <td>Bujumburra</td>
    <td>Yes</td>
</tr>
<tr>
    <td>What is the capital of France?</td>
    <td>F</td>
    <td>Erm... sort of</td>
</tr>
</table>
  Message=END
 #at least one empty line needed at the end!

和我需要提取和保存只有消息=和消息=END之间的文本。我尝试了split('='). last/First()。不好的。我不能使用Substring,因为它只接受int ofIndex。我是个新手,想不出解决办法。你能给个提示吗?

从文件中提取文本c#

你可以使用这个正则表达式:

/Message=(?<messagebody>(.*))Message=END/s

然后获取消息的代码:

string fileContent; //The content of your .mail file
MatchCollection match = Regex.Matches(fileContent, "/Message=(?<messagebody>(.*))Message=END/s");
string message = match[0].Groups["messagebody"].Value;

我将假设在文本文件或您正在寻找的消息中没有固定数量的行,我可以依赖。

        string prefix = "Message=";
        string postfix = "Message=END";
        var text = File.ReadAllText("a.txt");
        var messageStart = text.IndexOf(prefix) + prefix.Length;
        var messageStop = text.IndexOf(postfix);
        var result = text.Substring(messageStart, messageStop - messageStart);