从集合中查找和删除项目

本文关键字:删除项目 查找 集合 | 更新日期: 2023-09-27 18:27:00

从集合中删除集合,但仍将删除的项保留在单独的集合中的最佳方法是什么?

我已经写了一个可以做到这一点的扩展方法,但我认为一定有更好的方法。这是我的功能:

public static List<T> FindAndRemove<T>(this List<T> lst, Predicate<T> match)
{
    List<T> ret = lst.FindAll(match);
    lst.RemoveAll(match);
    return ret;
}

你会这样使用它:

List<String> myList = new List<String>();
myList.Add("ABC");
myList.Add("DEF");
myList.Add("ABC");
List<String> removed = myList.FindAndRemove(x => x == "ABC");
// myList now contains 1 item (DEF)
// removed now contains 2 items (ABC, ABC)

我不能100%确定FindAllRemoveAll方法的幕后情况,但我认为更好的方法是以某种方式将项目从一个列表"转移"到另一个列表。

从集合中查找和删除项目

Op的答案是迄今为止提出的和建议的解决方案中最好的。以下是我机器上的计时:

public static class Class1
{
    // 21ms on my machine
    public static List<T> FindAndRemove<T>(this List<T> lst, Predicate<T> match)
    {
        List<T> ret = lst.FindAll(match);
        lst.RemoveAll(match);
        return ret;
    }
    // 538ms on my machine
    public static List<T> MimoAnswer<T>(this List<T> lst, Predicate<T> match)
    {
        var ret = new List<T>();
        int i = 0;
        while (i < lst.Count)
        {
            T t = lst[i];
            if (!match(t))
            {
                i++;
            }
            else
            {
                lst.RemoveAt(i);
                ret.Add(t);
            }
        }
        return ret;
    }
    // 40ms on my machine
    public static IEnumerable<T> GuvanteSuggestion<T>(this IList<T> list, Func<T, bool> predicate)
    {
        var removals = new List<Action>();
        foreach (T item in list.Where(predicate))
        {
            T copy = item;
            yield return copy;
            removals.Add(() => list.Remove(copy));
        }
        // this hides the cost of processing though the work is still expensive
        Task.Factory.StartNew(() => Parallel.ForEach(removals, remove => remove()));
    }
}
[TestFixture]
public class Tester : PerformanceTester
{
    [Test]
    public void Test()
    {
        List<int> ints = Enumerable.Range(1, 100000).ToList();
        IEnumerable<int> enumerable = ints.GuvanteSuggestion(i => i % 2 == 0);
        Assert.That(enumerable.Count(), Is.EqualTo(50000));
    }
}

我不同意它是最有效的——您对列表的每个元素调用谓词match两次。

我会这样做:

    var ret = new List<T>(); 
    var remaining = new List<T>(); 
    foreach (T t in lst) {
        if (match(t)) 
        { 
            ret.Add(t); 
        } 
        else 
        { 
            remaining.Add(t); 
        } 
    }
    lst.Clear();
    lst.AddRange(remaining);
    return ret; 

您应该尝试将原始列表划分为两个新列表。实现应该在任何IEnumerable上工作,而不仅仅是列表,并且应该假设源是不可变的。请参阅这篇关于分区的文章:LINQ分区列表为8个成员的列表。我认为莫雷林克已经做好了准备。

根据集合的大小,您可能希望将其实现为HashSet而不是List。在足够大的集合中(根据我的经验,"足够"的大小在一定程度上取决于集合中的内容),HashSets在查找自身项方面可能比Lists快得多。