从集合中查找和删除项目
本文关键字:删除项目 查找 集合 | 更新日期: 2023-09-27 18:27:00
从集合中删除集合,但仍将删除的项保留在单独的集合中的最佳方法是什么?
我已经写了一个可以做到这一点的扩展方法,但我认为一定有更好的方法。这是我的功能:
public static List<T> FindAndRemove<T>(this List<T> lst, Predicate<T> match)
{
List<T> ret = lst.FindAll(match);
lst.RemoveAll(match);
return ret;
}
你会这样使用它:
List<String> myList = new List<String>();
myList.Add("ABC");
myList.Add("DEF");
myList.Add("ABC");
List<String> removed = myList.FindAndRemove(x => x == "ABC");
// myList now contains 1 item (DEF)
// removed now contains 2 items (ABC, ABC)
我不能100%确定FindAll
和RemoveAll
方法的幕后情况,但我认为更好的方法是以某种方式将项目从一个列表"转移"到另一个列表。
Op的答案是迄今为止提出的和建议的解决方案中最好的。以下是我机器上的计时:
public static class Class1
{
// 21ms on my machine
public static List<T> FindAndRemove<T>(this List<T> lst, Predicate<T> match)
{
List<T> ret = lst.FindAll(match);
lst.RemoveAll(match);
return ret;
}
// 538ms on my machine
public static List<T> MimoAnswer<T>(this List<T> lst, Predicate<T> match)
{
var ret = new List<T>();
int i = 0;
while (i < lst.Count)
{
T t = lst[i];
if (!match(t))
{
i++;
}
else
{
lst.RemoveAt(i);
ret.Add(t);
}
}
return ret;
}
// 40ms on my machine
public static IEnumerable<T> GuvanteSuggestion<T>(this IList<T> list, Func<T, bool> predicate)
{
var removals = new List<Action>();
foreach (T item in list.Where(predicate))
{
T copy = item;
yield return copy;
removals.Add(() => list.Remove(copy));
}
// this hides the cost of processing though the work is still expensive
Task.Factory.StartNew(() => Parallel.ForEach(removals, remove => remove()));
}
}
[TestFixture]
public class Tester : PerformanceTester
{
[Test]
public void Test()
{
List<int> ints = Enumerable.Range(1, 100000).ToList();
IEnumerable<int> enumerable = ints.GuvanteSuggestion(i => i % 2 == 0);
Assert.That(enumerable.Count(), Is.EqualTo(50000));
}
}
我不同意它是最有效的——您对列表的每个元素调用谓词match
两次。
我会这样做:
var ret = new List<T>();
var remaining = new List<T>();
foreach (T t in lst) {
if (match(t))
{
ret.Add(t);
}
else
{
remaining.Add(t);
}
}
lst.Clear();
lst.AddRange(remaining);
return ret;
您应该尝试将原始列表划分为两个新列表。实现应该在任何IEnumerable上工作,而不仅仅是列表,并且应该假设源是不可变的。请参阅这篇关于分区的文章:LINQ分区列表为8个成员的列表。我认为莫雷林克已经做好了准备。
根据集合的大小,您可能希望将其实现为HashSet而不是List。在足够大的集合中(根据我的经验,"足够"的大小在一定程度上取决于集合中的内容),HashSets在查找自身项方面可能比Lists快得多。