Linq,使用复杂的类结构进行过滤和检索

本文关键字:过滤 检索 结构 复杂 Linq | 更新日期: 2023-09-27 18:37:19

我有以下情况:

public class Term{
    private int _family;
    public void setFamily(int family){
         _family = family;
     }
    public int getFamily(){
        return _family
    }
}

public class Document{
     private List<Term> _terms_in_document;
     public void addTerm(Term t){
         _terms_in_document.add(t);
     }
}

在不同的班级...

   Term t1 = new Term();
   t1.setFamily(1);
   Term t2 = new Term();
   t2.setFamily(1);
   Term t3 = new Term();
   t3.setFamily(1);

   Document d1 = new Document();
    d1.addTerm(t1);
    d1.addTerm(t2);
    d1.addTerm(t3);
   Term t4 = new Term();
   t4.setFamily(1);
   Term t5 = new Term();
   t5.setFamily(2);
   Term t6 = new Term();
   t6.setFamily(3);

   Document d2 = new Document();
    d2.addTerm(t4);
    d2.addTerm(t5);
    d2.addTerm(t6);

我需要使用 LINQ 获取那些包含最多不同系列的术语的文档。在我们的示例中,d2 将排在第一位,因为它的项是族 1、2 和 3。虽然 d1 必须排在第二位,因为它的所有术语都属于同一个家族。到目前为止,我无法使用linq做到这一点,我相信没有它可以完成,但它将是非常复杂且容易出错的代码。你能帮帮我吗..

Linq,使用复杂的类结构进行过滤和检索

你应该使用属性。 这就是他们的目的。 此外,若要使用 LINQ,还需要一组文档。 简而言之,您的代码可以转换为:

public class Term
{
    public int Family { get; set; }
}
public class Document
{
    private List<Term> terms = new List<Term>();
    public List<Term> Terms { get { return terms; } set { terms = value; } } 
}
internal class Program
{
    private static void Main(string[] args)
    {
        Term t1 = new Term { Family = 1 };  // Object Initializer Syntax
        Term t2 = new Term { Family = 1 };
        Term t3 = new Term { Family = 1 };
        Document d1 = new Document();
        d1.Terms.Add(t1);
        d1.Terms.Add(t2);
        d1.Terms.Add(t3);
        Term t4 = new Term { Family = 1 };
        Term t5 = new Term { Family = 2 };
        Term t6 = new Term { Family = 3 };
        Document d2 = new Document();
        d2.Terms.Add(t4);
        d2.Terms.Add(t5);
        d2.Terms.Add(t6);
        List<Document> docs = new List<Document> {d1, d2};
    }
}

然后,您可以使用以下命令进行计算:

var mostDistinctFamilies = docs.GroupBy(d => d.Terms.Select(t => t.Family).Distinct().Count())
                               .OrderByDescending(d => d.Count())
                               .First();
您可以使用

GroupBy按家族编号对术语序列进行分组,然后调用Count以获取不同组的数量。

将所有这些放在一个OrderByDescending电话中,您将按所有术语的不同家庭的数量对文档进行排序。