是否有一种方法可以运行查询并检查聚合数据,而无需再次运行查询

本文关键字:运行 查询 数据 检查 一种 方法 是否 | 更新日期: 2023-09-27 18:13:08

在决定枚举LINQ查询的结果集之前,我想查看查询结果计数(可能还有其他聚合数据)。

几乎每个LINQ示例都会立即枚举foreach循环的结果。但是我想检查计数来确定是否需要循环遍历每个结果。是否有一种方法可以运行查询并检查聚合数据,而无需再次运行查询?如果我输入
query.Count()
foreach(var item in query) { ... }

我想它会执行查询两次,但它不需要再次执行…只能在Count()已经返回的结果集上枚举。

在查询SQL数据库时,通常首先运行单独的聚合查询,然后在需要时运行另一个查询来获取行数据是非常有效的。但是如果我正确理解了LINQ,它将执行相同的操作——相同的循环和逻辑,而不需要任何特定的优化——无论我是得到Count()还是执行foreach。是否有一个有效的和/或内置的方式来持久化多个操作的结果?

是否有一种方法可以运行查询并检查聚合数据,而无需再次运行查询

在。net中,IEnumerable<T>序列是惰性的:这意味着底层逻辑只在需要时执行。其副作用是,如果需要两次结果,则逻辑将执行两次。

例如,如果序列绑定到SQL数据库的结果,如果先计算元素的数量,然后列出所有元素,则SQL查询将执行两次。

一些LINQ方法只是转换获得的结果,而没有实际获得结果。例如,var b = a.Where(a > 0);不会运行底层逻辑,而是延迟到您真正需要结果时才运行。

其他LINQ方法有效地强制执行逻辑。例如,Count()将强制加载所有元素以便对它们进行计数。ToArray()ToList()也会这样做,将元素存储在内存中以供以后使用。

您正在寻找的方法完全取决于上下文。

通常,您可能希望将序列存储在内存中(例如使用ToList()),以便稍后对其执行多个操作,例如计算元素的数量,然后循环遍历所有元素。另一方面,在某些情况下,您将需要其他内容:

  • 为了在内存中加载所有内容,底层逻辑的影响可能太高,迫使您寻找更智能的解决方案。假设您正在进行数据库搜索,并且希望显示结果的数量(例如2 000 000)以及前20个条目。您真的需要将所有200000个结果存储在内存中吗?可能不会。

    这里的解决方案是执行count SQL查询(数据库引擎将能够优化),然后执行实际查询,获取前20个结果。

    一个类似的例子是当你得到几个元素,但它需要很多CPU周期来获得一个元素。有时候,当你只需要计算元素时,可以使用快捷键来缩短复杂的工作。

  • 或者相反的情况可能发生:底层逻辑和数据量太小,实际上不关心。假设您正在处理A-Za-z范围内的字符。真的有必要做ToList()吗?计数,然后分别循环遍历字符不是更容易吗?

  • 有时,甚至不可能将所有元素存储在内存中。例如,如果您有一个无限序列(例如从不断写入的日志文件中刷新的行),该怎么办?

但是如果我正确地理解了LINQ,它将执行相同的操作——相同的循环和逻辑局部没有任何特别的优化——无论我是否得到Count()或执行foreach。

这完全取决于您使用的ORM。当您创建LINQ查询时,例如:

var count = this.SequenceFromDatabase
    .Where(product => product.Price > 0)
    .Count();
foreach (var product in this.SequenceFromDatabase.Take(10))
{
    ...
}

一些(如果不是大多数)orm实际上会将其转换为:

select count(1) from [Schema].[Table] where [Price] > 0
select top 10 [Name], [Price], [Availability] from [Schema].[Table]

考虑到从LINQ到SQL查询的实际转换取决于orm和您编写的实际LINQ代码,因此密切关注正在执行的SQL查询是必要的。许多orm具有跟踪SQL查询的能力,并且一些SQL引擎还允许您对查询进行概要分析。