使用代码优先模型进行“可组合”全文搜索

本文关键字:可组合 文搜索 搜索 代码 模型 | 更新日期: 2023-09-27 18:30:54

更新 2013年9月18日

看起来没有一个简单的方法可以做到这一点。我坚持一个涉及实体框架扩展的解决方案。

如果您希望在实体框架中看到这些功能,请在用户语音网站上为它们投票,也许在这里和这里


SO上有几个类似的问题,但我找不到一个新的和相似的问题来获得我正在寻找的答案。

如果这看起来像信息过载,请跳转到"摘要"。

背景

我正在编写一个 WebApi REST 服务,以通过 OData 端点公开一些预先存在的数据。我正在使用EntitySetContoller<TEntity, TKey>为我完成所有繁重的工作。除了由基类路由和转换的标准 OData 参数外,我还添加了一些自定义参数,以允许控制器具有特定功能。

我的数据库服务器是 MS SQL Server,在[SomeEntity]表的[BigText] NVarChar[4000]列上有一个全文索引。

有一个限制,我必须使用代码优先模型。

// Model POCO
public class SomeEntity
{
    public int Id { get; set; }
    public string BigText { get; set; }
}
// Simple Controller
public class SomeEntityController : EntitySetController<SomeEntity, int>
{
    private readonly SomeDbContext context = new SomeDbContext();
    public override IQueryable<SomeEntity> Get()
    {
        var parameters = Request.GetQueryNameValuePairs()
            .ToDictionary(p => p.Key, p => p.Value);
        if (parameters.ContainsKey("BigTextContains")
        (
            var searchTerms = parameters["BigTextContains"];
            // return something special ... 
        )
        return this.context.SomeEntities;
    }
    // ... The rest is omitted for brevity.
}

问题所在

如何实现示例的// return something special ...部分?

显然,尼娅·

return this.context.SomeEntities.Where(e =>
    e.BigText.Contains(searchTerm));

是完全错误的,它组成了一个WHERE子句,例如

[BigText] LIKE '%' + @searchTerm + '%'

这不使用全文搜索,因此不支持复杂的搜索词,否则,执行可怕的操作。

这种方法,

return this.context.SomeEntities.SqlQuery(
    "SELECT E.* FROM [dbo].[SomeEntity] E " +
        "JOIN CONTAINSTABLE([SomeEntity], [BigText], @searchTerm) FTS " +
            " ON FTS.[Key] = E.[Id]",
    new object[] { new SqlParameter("@searchTerm", searchTerm) })
    .AsQueryable();

看起来很有前途,它实际上使用全文搜索,并且非常实用。但是,您会注意到DbSqlQuery ,从 SqlQuery 函数返回的类型不会实现IQueryable 。在这里,它被强制使用AsQueryable()扩展名到正确的返回类型,但这打破了"组合链"。将在服务器上执行的唯一语句是上面代码中指定的语句。在 OData URL 上指定的任何其他子句都将在托管 Web 服务器的 API 上提供服务,而不会受益于数据库引擎的索引和基于专用集的功能。

总结

使用实体框架 5 代码优先模型访问 MS SQL Server 的全文搜索CONTAINSTABLE功能并获得"可组合"结果的最便捷方法是什么?

我需要自己写IQueryProvider吗?是否可以以某种方式扩展 EF?

我不想使用 Lucene.Net,我不想使用数据库生成的模型。也许我可以添加额外的包或等待 EF6,这会有帮助吗?

使用代码优先模型进行“可组合”全文搜索

它并不完美,但您可以通过对数据库的 2 次调用来完成您所追求的目标。第一次调用将从 CONTAINSTABLE 检索匹配键的列表,然后第二次调用将是使用从第一次调用返回的 ID 的可组合查询。

//Get the Keys from the FTS
var ids = context.Database.SqlQuery<int>( 
          "Select [KEY] from CONTAINSTABLE([SomeEntity], [BigText], @searchTerm)", 
          new object[] { new SqlParameter("@searchTerm", searchTerm) });
//Use the IDs as an initial filter on the query
var composablequery = context.SomeEntities.Where(d => ids.Contains(d.Id));
//add on whatever other parameters were captured to the 'composablequery' variable
composablequery = composablequery.Where(.....)

我最近遇到了同样的问题:EF 5 代码优先 FTS 可查询

让我延长一下这个职位。

  • 您的第一个选择也是我的 - 使用 SqlQuery我还需要做更多的过滤,所以我没有总是编写完整的sql,而是使用了QueryBuilder,我对其进行了一些更改并添加了更多函数以满足我的需求(如果需要,我可以将其上传到某个地方):查询生成器

  • 在我找到了我实施的另一个想法之后。有人已经在这里提到了它,那就是使用 SqlQuery,它将返回 HashSet of Id,并且您可以在带有 Contains 的 EF 查询中使用它。这更好,但不是最佳选择,因为您需要 2 个查询和内存中的 Id 列表。例:

        public IQueryable<Company> FullTextSearchCompaniesByName(int limit, int offset, string input, Guid accountingBureauId, string orderByColumn)
    {
        FtsQueryBuilder ftsQueryBuilder = new FtsQueryBuilder();
        ftsQueryBuilder.Input = FtsQueryBuilder.FormatQuery(input);
        ftsQueryBuilder.TableName = FtsQueryBuilder.GetTableName<Company>();
        ftsQueryBuilder.OrderByTable = ftsQueryBuilder.TableName;
        ftsQueryBuilder.OrderByColumn = orderByColumn;
        ftsQueryBuilder.Columns.Add("CompanyId");
        if (accountingBureauId != null && accountingBureauId != Guid.Empty)
            ftsQueryBuilder.AddConditionQuery<Guid>(Condition.And, "" , @"dbo.""Company"".""AccountingBureauId""", Operator.Equals, accountingBureauId, "AccountingBureauId", "");
        ftsQueryBuilder.AddConditionQuery<bool>(Condition.And, "", @"dbo.""Company"".""Deleted""", Operator.Equals, false, "Deleted", "");
        var companiesQuery = ftsQueryBuilder.BuildAndExecuteFtsQuery<Guid>(Context, limit, offset, "Name");
        TotalCountQuery = ftsQueryBuilder.Total;
        HashSet<Guid> companiesIdSet = new HashSet<Guid>(companiesQuery);
        var q = Query().Where(a => companiesIdSet.Contains(a.CompanyId));
        return q;
    }
    
  • 但是,EF 6 现在有一个名为拦截器的东西,可用于实现可查询的 FTS,它非常简单和通用(上一篇文章):用于 FTS 的 EF 6 拦截器。我已经对此进行了测试,它工作正常。

!!备注:EF Code First(即使使用版本 6)也不支持自定义存储过程。如果我理解得很好,只有一些用于预定义的 CUD 操作:代码首先插入/更新/删除存储过程映射,因此无法使用它。

结论:如果你可以使用EF 6去第三个选项,是提供你需要的一切。如果您遇到 EF 5 或更低版本,则第二个选项比第一个选项更好,但不是最理想的。