对于每个单词(section中的另一个单词是'something')

本文关键字:单词 something 于每个 section 另一个 | 更新日期: 2023-09-27 18:14:17

我不确定这是否可能,但是…

我有一大块文本(kml格式,基本上是xml),它包含的代码部分看起来像这样(大约75个)

<color>ff0780dd</color> *bgcolor
<th>MSOA11CD</th> *code
<td>E02001618</td>

我需要做的是,设置*bgcolor,其中每个*代码是不同的,一旦我有*代码,我可以在我的DB中查看并分配正确的颜色。

我可以使用正则表达式来获得以"MSOA+4chars"开头的每个*代码,但我该如何编辑上面的颜色代码呢?

欢呼

对于每个单词(section中的另一个单词是'something')

如果是XML,那么你可以使用LINQ to XML

// find nodes 
XNamespace ns = "url....";
var doc = XDocument.Load("Test.xml");
var items =( from item in doc.Descendants(ns+"Document").Descendants(ns+"Item")
            where CheckItem(item.Element(ns+"th").Value)
            select item).ToList();
// update nodes 
for (int i = 0; i < items.Count(); i++)
{
    items[i].SetElementValue(ns + "color", GetColor(items[i].Value));
}
// saving updated xml 
doc.Save("Test.xml");
相关:使用c#读取XML/KML文件

这是一个使用正则表达式的解决方案。此表达式中的匹配将捕获示例中的COLOR标记和TH标记。

<color>[^<]+</color>'s*<th>MSOA('w+)</th>

第一个捕获组包含4位MSOA代码。然后,您可以用具有所需更新值的新标记替换整个匹配。下面是我在LINQPad中测试的c#示例。

void Main() {
    string inputString = @"
        <color>ff0780dd</color>
        <th>MSOA11CD</th>
        <td>E02001618</td>";
    string result = Regex.Replace(inputString, @"<color>[^<]+</color>'s*<th>MSOA('w+)</th>", new MatchEvaluator(ComputeReplacement), RegexOptions.IgnoreCase | RegexOptions.Multiline);
    Console.Out.WriteLine(result);
}
public String ComputeReplacement(Match m) {
    const int GRP_MSOA_CODE = 1;
    string msoaCode = m.Groups[GRP_MSOA_CODE].Value;
    string colorCode = "SOME COLOR CODE"; //Get the code to use between the "color" tags from your DB.
    return String.Format("<color>{0}</color>'n<th>MSOA{1}</th>", colorCode, msoaCode);
}