对字符串编号进行排序

本文关键字:排序 编号 字符串 | 更新日期: 2023-09-27 18:29:45

可能重复:
C#中的自然排序

我有一张单子,上面有很多数字。但是由于一些附加的字母,它们被保存为字符串。

我的列表如下:

1
10
11
11a
11b
12
2
20
21a
21c
A1
A2
...

但它应该看起来像这个

1
2
10
11a
11b
...
A1
A2
...

如何对列表进行排序以获得此结果?

对字符串编号进行排序

根据前面的注释,我还将实现一个自定义的IComparer<T>类。据我所知,这些项目的结构要么是数字,要么是数字后面跟着字母的组合。如果是这种情况,下面的IComparer<T>实现应该可以工作。

public class CustomComparer : IComparer<string>
{
    public int Compare(string x, string y)
    {
        var regex = new Regex("^(d+)");
        // run the regex on both strings
        var xRegexResult = regex.Match(x);
        var yRegexResult = regex.Match(y);
        // check if they are both numbers
        if (xRegexResult.Success && yRegexResult.Success)
        {
            return int.Parse(xRegexResult.Groups[1].Value).CompareTo(int.Parse(yRegexResult.Groups[1].Value));
        }
        // otherwise return as string comparison
        return x.CompareTo(y);
    }
}

有了这个IComparer<T>,你就可以通过对你的string列表进行排序

var myComparer = new CustomComparer();
myListOfStrings.Sort(myComparer);

这已经用以下项目进行了测试:

2, 1, 4d, 4e, 4c, 4a, 4b, A1, 20, B2, A2, a3, 5, 6, 4f, 1a

并给出结果:

1, 1a, 2, 20, 4a, 4b, 4c, 4d, 4e, 4f, 5, 6, A1, A2, a3, B2

由于这包括许多字符串操作、正则表达式等,我认为这不是一个有效的算法,但它似乎有效。

List<string> list1 = new List<string>() { "11c22", "1", "10", "11", "11a", "11b", "12", "2", "20", "21a", "21c", "A1", "A2" };
List<string> list2 = new List<string>() { "File (5).txt", "File (1).txt", "File (10).txt", "File (100).txt", "File (2).txt" };
var sortedList1 = NaturalSort(list1).ToArray();
var sortedList2 = NaturalSort(list2).ToArray();

public static IEnumerable<string> NaturalSort(IEnumerable<string> list)
{
    int maxLen = list.Select(s => s.Length).Max();
    Func<string, char> PaddingChar = s => char.IsDigit(s[0]) ? ' ' : char.MaxValue;
    return list
            .Select(s =>
                new
                {
                    OrgStr = s,
                    SortStr = Regex.Replace(s, @"('d+)|('D+)", m => m.Value.PadLeft(maxLen, PaddingChar(m.Value)))
                })
            .OrderBy(x => x.SortStr)
            .Select(x => x.OrgStr);
}

好吧,您需要从每个字符串中提取数字,然后根据作为键的数字列表对字符串列表进行排序。分两步进行。

要从每个字符串中提取数字,我认为最简单的方法是使用正则表达式-查找('d+)的匹配项(如果您有负数或十进制数,则必须使用不同的正则表达式)。假设您在一个名为ExtractNumber 的函数中做到了这一点

现在你可以使用一些有创意的LINQ进行排序,比如:

strings.Select(s=>new { key=ExtractNumber(s), value=s }) // Create a key-value pair
       .OrderBy(p=>p.key)                                // Sort by key
       .Select(p=>p.Value);                              // Extract the values

我对C#很陌生,但这里有一个我很欣赏的Java解决方案:您需要分两个步骤进行,首先定义一个自定义的IComparer,然后在调用排序方法时使用它。所以你应该能够做一些类似的事情:

public class MyListSorter : IComparer<MyObject>
{
  public int Compare(MyObject obj1, MyObject obj2)
  {
    if ( !Char.IsNumber(obj1) && Char.IsNumber(obj2) )
    {
       return 0;
    }
    else if ( Char.IsNumber(obj1) && !Char.IsNumber(obj2) )
    {
      return 1;
    }
    else
    {
      return obj2.CompareTo(obj1);
    }
  }
}

然后

myObjectList.Sort(new MyListSorter());

有关IComparer的更多信息:http://support.microsoft.com/kb/320727