使用/斜杠拆分数组
本文关键字:拆分 数组 使用 | 更新日期: 2023-09-27 18:27:45
从我的数组字符串中的调试器中,我得到了这个:
"/mercedes-benz/190-class/1993/" class="canonicalLink" data-qstring="?sub=sedan">1993
我希望在每个'/'
之后分割文本,并将其放入string[]
,这是我的努力:
Queue<string> see = new Queue<string>(); //char[] a = {''n '};
List<car_facts> car_fact_list = new List<car_facts>();
string[] car_detail;
foreach (string s in car)
{
MatchCollection match = Regex.Matches(s, @"<a href=(.+?)</a>",
RegexOptions.IgnoreCase);
// Here we check the Match instance.
foreach(Match mm in match)
{
// Finally, we get the Group value and display it.
string key = mm.Groups[1].Value;
//key.TrimStart('"');
//key.Trim('"');
key.Trim();
// @HERE: I tried with string.Split as well and tried many combinations of separators
car_detail = Regex.Split(key, "//");
see.Enqueue(key);
}
}
在car_detail[0]
中,我得到了这个"$[link]">$[title]
来自此字符串:
"/mercedes-benz/190-class/1993/" class="canonicalLink" data-qstring="?sub=sedan">1993
不清楚为什么在这里使用双斜杠。。。
string[] details = key.Split('/');
应该可以正常工作。(请注意,C#中不必转义前斜杠。)例如:
using System;
class Test
{
static void Main()
{
string text = "/mercedes-benz/190-class/1993/";
string[] bits = text.Split('/');
foreach (string bit in bits)
{
Console.WriteLine("'{0}'", bit);
}
}
}
输出:
''
'mercedes-benz'
'190-class'
'1993'
''
空字符串是由于前导斜杠和尾随斜杠造成的。如果你想避免这些,你可以使用
string[] details = key.Split(new[] {'/'}, StringSplitOptions.RemoveEmptyEntries);
注:
car_facts
是C#中一个非常非常规的名称。通常情况下,你会有类似CarFacts
的东西(或者可能只有Car
、CarInfo
等)。类似地,car_fact_list
通常是carFactList
或类似的东西。这段代码没有达到你所期望的效果:
key.Trim();
字符串在.NET中是不可变的,因此
Trim()
返回对新字符串的引用,而不是更改现有字符串的内容。您可能想要:key = key.Trim();
您当前正在为
car_detail
指定一个值,但从未使用过。为什么?一般来说,使用正则表达式解析HTML是一个非常糟糕的主意。考虑使用HTML敏捷包或类似的东西。