将ICollection成员与其自身进行比较

本文关键字:比较 ICollection 成员 | 更新日期: 2023-09-27 18:20:24

有什么最便宜的方法可以将ICollection与自身进行比较吗。

这是我的代码:

        public IEnumerable<Pet> speciesChecker()
        {
            foreach (Pet pet in _pets)
            {
                bool wantedSpecies = true;
                foreach (Pet pet2 in _pets)
                {
                    if (pet2 != pet && pet.Species == pet2.Species)
                    {
                        wantedSpecies = false;
                        break;
                    }
                }
                if (wantedSpecies) yield return pet;
            }
        }

我的代码的时间复杂度是多少,我只知道它小于O(N^2),如果我从foreach内部循环中删除"break",时间复杂度将为O(N^2)。如果我错了,请纠正我。

将ICollection成员与其自身进行比较

以下是我对它的看法:

var q = list.GroupBy (l => l.Species)
          .Where (l => l.ElementAtOrDefault(1) == null)
          .Select (l => l.Key)

GroupBy将在内部使用HashSet,因此O(N)
ElementAtOrDefault(1)只需要将枚举器移动一步,因此不会为O(n)

I认为这段代码也做同样的事情。在这种情况下,这是一个O(N)算法。诀窍是将宠物存储在按物种编制索引的词典中。

    public IEnumerable<Pet> speciesChecker()
    {
        var species = new Dictionary<Species, List<Pet>>();
        foreach (Pet pet in _pets)
        {
            // create the list if it doesn't exist
            if (!species.ContainsKey(pet.Species))
                species[pet.Species] = new List<Pet>();
            species[pet.Species].Add(pet);
        }
        // foreach species, if there is only one pet of that species, then return it
        foreach (var speciesPets in species.Values)
        {
            if (speciesPets.Count() == 1)
                yield return speciesPets.First();
        }
        yield break;
    }

您还可以使用以下内容,也应该是O(N):

public IEnumerable<Pet> speciesChecker ()
{
    _pets.GroupBy (p => p.Species)
         .Select (g => new List<Pet> (g))
         .Where (l => l.Count == 1)
         .SelectMany (l => l);
}

额外的Select (g => new List<Pet> (g))可能是多余的,但我相信这将有助于避免第二次迭代整个分组逻辑,我相信这会导致O(N^2)。

编辑:Magnus对在O(n)中操作的List构造函数破坏目的的好评论。。。

怎么样:

public IEnumerable<Pet> speciesChecker ()
{
    var groups = _pets.GroupBy (p => p.Species);
    foreach (var grp in _pets.GroupBy (p => p.Species))
    using (var e = grp.GetEnumerator ()) {
        if (!e.MoveNext ())
            continue;
        var first = e.Current;
        if (e.MoveNext ())
            continue;
        yield return first;
    }
}

认为这是尽可能优化的,并且将在O(n)中工作。我们也避免使用IEnumerable<T>.Any ()IEnumerable<T>.Count ()扩展方法。

想法?

n_pets collection 的长度

需要中断的步骤数:

1+2+3+...+n = n*(n+1)/2 =n^2/2 + n/2 = O(n^2) (for each pet in _pets);

有两个简单的规则如何从维基计算O:

  1. 如果f(x)是几个项的和保持了增长率,而忽略了所有其他因素。

  2. 如果f(x)是几个因子的乘积,则不依赖于x的乘积)。

无中断所需步骤数:

n+n+n+...+n = n^2 = O(n^2)