是否有一种方法可以运行查询并检查聚合数据,而无需再次运行查询
本文关键字:运行 查询 数据 检查 一种 方法 是否 | 更新日期: 2023-09-27 18:13:08
在决定枚举LINQ查询的结果集之前,我想查看查询结果计数(可能还有其他聚合数据)。
几乎每个LINQ示例都会立即枚举foreach循环的结果。但是我想检查计数来确定是否需要循环遍历每个结果。是否有一种方法可以运行查询并检查聚合数据,而无需再次运行查询?如果我输入query.Count()
foreach(var item in query) { ... }
我想它会执行查询两次,但它不需要再次执行…只能在Count()已经返回的结果集上枚举。
在查询SQL数据库时,通常首先运行单独的聚合查询,然后在需要时运行另一个查询来获取行数据是非常有效的。但是如果我正确理解了LINQ,它将执行相同的操作——相同的循环和逻辑,而不需要任何特定的优化——无论我是得到Count()还是执行foreach。是否有一个有效的和/或内置的方式来持久化多个操作的结果?
在。net中,IEnumerable<T>
序列是惰性的:这意味着底层逻辑只在需要时执行。其副作用是,如果需要两次结果,则逻辑将执行两次。
例如,如果序列绑定到SQL数据库的结果,如果先计算元素的数量,然后列出所有元素,则SQL查询将执行两次。
一些LINQ方法只是转换将获得的结果,而没有实际获得结果。例如,var b = a.Where(a > 0);
不会运行底层逻辑,而是延迟到您真正需要结果时才运行。
其他LINQ方法有效地强制执行逻辑。例如,Count()
将强制加载所有元素以便对它们进行计数。ToArray()
或ToList()
也会这样做,将元素存储在内存中以供以后使用。
您正在寻找的方法完全取决于上下文。
通常,您可能希望将序列存储在内存中(例如使用ToList()
),以便稍后对其执行多个操作,例如计算元素的数量,然后循环遍历所有元素。另一方面,在某些情况下,您将需要其他内容:
-
为了在内存中加载所有内容,底层逻辑的影响可能太高,迫使您寻找更智能的解决方案。假设您正在进行数据库搜索,并且希望显示结果的数量(例如2 000 000)以及前20个条目。您真的需要将所有200000个结果存储在内存中吗?可能不会。
这里的解决方案是执行
count
SQL查询(数据库引擎将能够优化),然后执行实际查询,获取前20个结果。一个类似的例子是当你得到几个元素,但它需要很多CPU周期来获得一个元素。有时候,当你只需要计算元素时,可以使用快捷键来缩短复杂的工作。
-
或者相反的情况可能发生:底层逻辑和数据量太小,实际上不关心。假设您正在处理
A-Za-z
范围内的字符。真的有必要做ToList()
吗?计数,然后分别循环遍历字符不是更容易吗? -
有时,甚至不可能将所有元素存储在内存中。例如,如果您有一个无限序列(例如从不断写入的日志文件中刷新的行),该怎么办?
但是如果我正确地理解了LINQ,它将执行相同的操作——相同的循环和逻辑局部没有任何特别的优化——无论我是否得到Count()或执行foreach。
这完全取决于您使用的ORM。当您创建LINQ查询时,例如:
var count = this.SequenceFromDatabase
.Where(product => product.Price > 0)
.Count();
foreach (var product in this.SequenceFromDatabase.Take(10))
{
...
}
一些(如果不是大多数)orm实际上会将其转换为:
select count(1) from [Schema].[Table] where [Price] > 0
select top 10 [Name], [Price], [Availability] from [Schema].[Table]
考虑到从LINQ到SQL查询的实际转换取决于orm和您编写的实际LINQ代码,因此密切关注正在执行的SQL查询是必要的。许多orm具有跟踪SQL查询的能力,并且一些SQL引擎还允许您对查询进行概要分析。