Lucene.net/Lucene的最低分数

本文关键字:Lucene 最低分 net | 更新日期: 2023-09-27 17:57:26

是否可以设置在Lucene中返回结果的最低分数?

我有这个功能:

public Tuple<int,ICollection<Guid>> Search(string searchQuery,int maxResults)
{
    var booleanQuery = new BooleanQuery();
    var s1 = new TermQuery(new Term("companyName", searchQuery));
    booleanQuery.Add(s1, Occur.SHOULD);
    using (var searcher = new IndexSearcher(this.Directory))
    {
        TopDocs hits = searcher.Search(booleanQuery, maxResults);
        var ids = new List<Guid>();
        for (int i = 0; i < hits.ScoreDocs.Count(); i++)
        {
            var idString = searcher.Doc(hits.ScoreDocs[i].Doc).Get("id");
            ids.Add(new Guid(idString));
        }
        return new Tuple<int, ICollection<Guid>>(hits.TotalHits, ids);
    }
}

该函数搜索我的索引,并返回与searchQuery匹配的公司的ID,以及与搜索匹配的公司总数,这样我就可以写"显示245家匹配公司中的1-20家"。

我的问题是比赛的门槛很低。如果用户输入"accountant",则搜索会返回有意义的结果,但如果用户输入了"adasdfsdf",则返回不相关的结果。如果结果不够相关,我宁愿显示一条类似"对不起,没有公司符合您的查询"的消息。

有可能为比赛设定最低分数吗?TopDocs.TotalHits属性是否尊重此分数?

Lucene.net/Lucene的最低分数

简而言之,没有。您无法在Lucene中真正创建最低分数截止点。这里有一个为什么不讨论。请注意,这里讨论的案例与您的要求有点不同,但困难大致相同(事实上,提供一个合理的分界点用于不同的独立查询会带来更大的困难,尽管这些困难密切相关)。

解决这个问题的更好方法是设计查询,这样就不会得到无关的结果。在您的例子中,我真的不明白为什么会出现很多不相关的结果,所以我假设还有其他术语被添加到查询中。在这种情况下,如果您只想获得与new Term("companyName", searchQuery)匹配的文档,那么您应该使用Occur.MUST booleanCClause添加它,比如:

var booleanQuery = new BooleanQuery();
var s1 = new TermQuery(new Term("companyName", searchQuery));
booleanQuery.Add(s1, Occur.MUST);

为了进一步解释,Occur.MUSTOccur.SHOULD是您的问题。如果你有这样的查询:

category:type1 companyName:asdfdas

如果companyName上没有结果,那么您只会看到查询category:type1的结果。如果你在companyName上有匹配项,这些结果将被判断为具有更高的相关性,并将首先显示,但它仍然会显示与该类别匹配的所有内容,只是在列表中排名较低。在该示例中,这两个项都添加了BooleanClause.Occur.SHOULD,因此两者都是可选的(尽管在任何结果中仍必须找到至少一个匹配项)。

如果您希望只显示与类别和companyName都匹配的术语,则应使用BooleanClause.Occur.MUST在查询中使这两个术语都是必填术语。使用查询语法,这看起来像:

+category:type1 +companyName:asdfdas

或者构建BooleanQuery:

var s1 = new TermQuery(new Term("companyName", "asdfdas"));
booleanQuery.Add(s1, Occur.MUST);
var s1 = new TermQuery(new Term("category", "type1"));
booleanQuery.Add(s1, Occur.MUST);