使用c#解析RichTextBox中的文本

本文关键字:文本 RichTextBox 解析 使用 | 更新日期: 2023-09-27 18:18:01

有一种HTML正在被读取到RichTextBox(见下文)。假设HTML中有多个<h3>标记,如下所示。我需要在c#中编写一个方法,可以解析RichTextBox <h3>中的文本,并返回一个逗号分隔的字符串。

假设带有<h3>标签的标题为

...<h3>Title1</h3> ...
...<h3>Title2</h3> ...
...<h3>Title3</h3> ...

那么该方法应该返回Title1、Title2 Title3 .

谢谢你的帮助

使用c#解析RichTextBox中的文本

也许你可以试试这样做:

        string value = @"...<h3>Title1</h3> ......<h3>Title2</h3> ......<h3>Title3</h3> ...";
        List<string> ListOfTags = new List<string>();
        string[] split1 = value.Split(new string[] { "<h3>" }, StringSplitOptions.RemoveEmptyEntries);
        foreach (var item in split1.Skip(1))
        {
            string[] split2 = item.Split(new string[] { "</h3>" }, StringSplitOptions.RemoveEmptyEntries);
            ListOfTags.Add(split2[0]);
        }
        var result = String.Join(", ", ListOfTags.ToArray());
        Console.WriteLine(result);
        //Output => Title1, Title2, Title3