使用代码优先模型进行“可组合”全文搜索
本文关键字:可组合 文搜索 搜索 代码 模型 | 更新日期: 2023-09-27 18:30:54
更新 2013年9月18日
看起来没有一个简单的方法可以做到这一点。我坚持一个涉及实体框架扩展的解决方案。
如果您希望在实体框架中看到这些功能,请在用户语音网站上为它们投票,也许在这里和这里
SO上有几个类似的问题,但我找不到一个新的和相似的问题来获得我正在寻找的答案。
如果这看起来像信息过载,请跳转到"摘要"。
背景
我正在编写一个 WebApi REST 服务,以通过 OData 端点公开一些预先存在的数据。我正在使用EntitySetContoller<TEntity, TKey>
为我完成所有繁重的工作。除了由基类路由和转换的标准 OData 参数外,我还添加了一些自定义参数,以允许控制器具有特定功能。
我的数据库服务器是 MS SQL Server,在[SomeEntity]
表的[BigText] NVarChar[4000]
列上有一个全文索引。
有一个限制,我必须使用代码优先模型。
// Model POCO
public class SomeEntity
{
public int Id { get; set; }
public string BigText { get; set; }
}
// Simple Controller
public class SomeEntityController : EntitySetController<SomeEntity, int>
{
private readonly SomeDbContext context = new SomeDbContext();
public override IQueryable<SomeEntity> Get()
{
var parameters = Request.GetQueryNameValuePairs()
.ToDictionary(p => p.Key, p => p.Value);
if (parameters.ContainsKey("BigTextContains")
(
var searchTerms = parameters["BigTextContains"];
// return something special ...
)
return this.context.SomeEntities;
}
// ... The rest is omitted for brevity.
}
问题所在
如何实现示例的// return something special ...
部分?
显然,尼娅·
return this.context.SomeEntities.Where(e =>
e.BigText.Contains(searchTerm));
是完全错误的,它组成了一个WHERE
子句,例如
[BigText] LIKE '%' + @searchTerm + '%'
这不使用全文搜索,因此不支持复杂的搜索词,否则,执行可怕的操作。
这种方法,
return this.context.SomeEntities.SqlQuery(
"SELECT E.* FROM [dbo].[SomeEntity] E " +
"JOIN CONTAINSTABLE([SomeEntity], [BigText], @searchTerm) FTS " +
" ON FTS.[Key] = E.[Id]",
new object[] { new SqlParameter("@searchTerm", searchTerm) })
.AsQueryable();
看起来很有前途,它实际上使用全文搜索,并且非常实用。但是,您会注意到DbSqlQuery
,从 SqlQuery
函数返回的类型不会实现IQueryable
。在这里,它被强制使用AsQueryable()
扩展名到正确的返回类型,但这打破了"组合链"。将在服务器上执行的唯一语句是上面代码中指定的语句。在 OData URL 上指定的任何其他子句都将在托管 Web 服务器的 API 上提供服务,而不会受益于数据库引擎的索引和基于专用集的功能。
总结
使用实体框架 5 代码优先模型访问 MS SQL Server 的全文搜索CONTAINSTABLE
功能并获得"可组合"结果的最便捷方法是什么?
我需要自己写IQueryProvider
吗?是否可以以某种方式扩展 EF?
我不想使用 Lucene.Net,我不想使用数据库生成的模型。也许我可以添加额外的包或等待 EF6,这会有帮助吗?
它并不完美,但您可以通过对数据库的 2 次调用来完成您所追求的目标。第一次调用将从 CONTAINSTABLE 检索匹配键的列表,然后第二次调用将是使用从第一次调用返回的 ID 的可组合查询。
//Get the Keys from the FTS
var ids = context.Database.SqlQuery<int>(
"Select [KEY] from CONTAINSTABLE([SomeEntity], [BigText], @searchTerm)",
new object[] { new SqlParameter("@searchTerm", searchTerm) });
//Use the IDs as an initial filter on the query
var composablequery = context.SomeEntities.Where(d => ids.Contains(d.Id));
//add on whatever other parameters were captured to the 'composablequery' variable
composablequery = composablequery.Where(.....)
我最近遇到了同样的问题:EF 5 代码优先 FTS 可查询
让我延长一下这个职位。
-
您的第一个选择也是我的 - 使用 SqlQuery我还需要做更多的过滤,所以我没有总是编写完整的sql,而是使用了QueryBuilder,我对其进行了一些更改并添加了更多函数以满足我的需求(如果需要,我可以将其上传到某个地方):查询生成器
-
在我找到了我实施的另一个想法之后。有人已经在这里提到了它,那就是使用 SqlQuery,它将返回 HashSet of Id,并且您可以在带有 Contains 的 EF 查询中使用它。这更好,但不是最佳选择,因为您需要 2 个查询和内存中的 Id 列表。例:
public IQueryable<Company> FullTextSearchCompaniesByName(int limit, int offset, string input, Guid accountingBureauId, string orderByColumn) { FtsQueryBuilder ftsQueryBuilder = new FtsQueryBuilder(); ftsQueryBuilder.Input = FtsQueryBuilder.FormatQuery(input); ftsQueryBuilder.TableName = FtsQueryBuilder.GetTableName<Company>(); ftsQueryBuilder.OrderByTable = ftsQueryBuilder.TableName; ftsQueryBuilder.OrderByColumn = orderByColumn; ftsQueryBuilder.Columns.Add("CompanyId"); if (accountingBureauId != null && accountingBureauId != Guid.Empty) ftsQueryBuilder.AddConditionQuery<Guid>(Condition.And, "" , @"dbo.""Company"".""AccountingBureauId""", Operator.Equals, accountingBureauId, "AccountingBureauId", ""); ftsQueryBuilder.AddConditionQuery<bool>(Condition.And, "", @"dbo.""Company"".""Deleted""", Operator.Equals, false, "Deleted", ""); var companiesQuery = ftsQueryBuilder.BuildAndExecuteFtsQuery<Guid>(Context, limit, offset, "Name"); TotalCountQuery = ftsQueryBuilder.Total; HashSet<Guid> companiesIdSet = new HashSet<Guid>(companiesQuery); var q = Query().Where(a => companiesIdSet.Contains(a.CompanyId)); return q; }
-
但是,EF 6 现在有一个名为拦截器的东西,可用于实现可查询的 FTS,它非常简单和通用(上一篇文章):用于 FTS 的 EF 6 拦截器。我已经对此进行了测试,它工作正常。
!!备注:EF Code First(即使使用版本 6)也不支持自定义存储过程。如果我理解得很好,只有一些用于预定义的 CUD 操作:代码首先插入/更新/删除存储过程映射,因此无法使用它。
结论:如果你可以使用EF 6去第三个选项,是提供你需要的一切。如果您遇到 EF 5 或更低版本,则第二个选项比第一个选项更好,但不是最理想的。