使用c#解析RichTextBox中的文本
本文关键字:文本 RichTextBox 解析 使用 | 更新日期: 2023-09-27 18:18:01
有一种HTML正在被读取到RichTextBox(见下文)。假设HTML中有多个<h3>
标记,如下所示。我需要在c#中编写一个方法,可以解析RichTextBox <h3>
中的文本,并返回一个逗号分隔的字符串。
假设带有<h3>
标签的标题为
...<h3>Title1</h3> ...
...<h3>Title2</h3> ...
...<h3>Title3</h3> ...
那么该方法应该返回Title1、Title2 Title3 .
谢谢你的帮助
也许你可以试试这样做:
string value = @"...<h3>Title1</h3> ......<h3>Title2</h3> ......<h3>Title3</h3> ...";
List<string> ListOfTags = new List<string>();
string[] split1 = value.Split(new string[] { "<h3>" }, StringSplitOptions.RemoveEmptyEntries);
foreach (var item in split1.Skip(1))
{
string[] split2 = item.Split(new string[] { "</h3>" }, StringSplitOptions.RemoveEmptyEntries);
ListOfTags.Add(split2[0]);
}
var result = String.Join(", ", ListOfTags.ToArray());
Console.WriteLine(result);
//Output => Title1, Title2, Title3