如何使用ElasticSearch只返回属性的子集

本文关键字:属性 子集 返回 何使用 ElasticSearch | 更新日期: 2023-09-27 18:28:43

假设我启动了一个ElasticSearch并运行了一个Blog对象。

 public class Blog
 {
     [ElasticProperty(Name = "guid", Index = FieldIndexOption.NotAnalyzed, Type = FieldType.String)]
     public Guid? Guid { get; set; }
     [ElasticProperty(Name = "title", Index = FieldIndexOption.Analyzed, Type = FieldType.String)]
    public string Title { get; set; } = "";
     [ElasticProperty(Name = "body", Index = FieldIndexOption.Analyzed, Type = FieldType.String)]
     public string Body { get; set; } = "";
     [ElasticProperty(Name = "publishedDate", Index = FieldIndexOption.Analyzed, Type = FieldType.Date)]
     public DateTime PublishedDate { get; set; }
}

现在我只想将属性的子集返回到一个新的类中

 public class BlogListItem
 {
       public static Expression<Func<Blog, object>> Selector = e => new BlogListItem
        {
            Title =  e.Title,
            PublishedDate = e.PublishedDate,
        };
        public string Title { get; set; }
        public DateTime PublishedDate { get; set; }
 }

通常我使用实体框架,在那里我会像在BlogListItem类中一样编写选择器,但我发现在使用NEST 的ElasticSearch中很难找到任何关于这样做的信息

var res = elastic.Search<Blog>(s => s
           .From(0)
           .Size(3)
           .Index(blogIndex)
           .Query(q => q.MatchAll())
           .Sort(o => o.OnField(p => p.PublishedDate))
           .Fields(BlogListItem.Selector)
           );
  var result = res.Hits.Select(e => e.Source).ToList();

这返回了正确的命中次数,但由于源为null,我不知道在哪里可以找到返回的属性。

解决方案1我找到了一个替代解决方案,但如果这是一个好的解决方案,我希望能提供意见。

var res2 = elastic.Search<Blog, BlogListItem>(s => s
             .From(0)
             .Size(3)
             .Index(blogIndex)
             .Query(q => q.MatchAll())
             .Sort(o => o.OnField(p => p.PublishedDate))
             );
List<BlogListItem> resultList = res2.Hits.Select(hit => hit.Source).ToList();

这给了我返回的正确对象,但我对映射没有任何控制,我不确定它是否返回所有属性,然后再进行映射。

解决方案2.5在这个解决方案中,我用一个新的Selector更新了我的BlogListItem。

    public class BlogListItem
    {
        public static SearchSourceDescriptor<Blog> Selector(SearchSourceDescriptor<Blog> sr)
        {
            return sr.Include(fi => fi.Add(f => f.Title));
        }
        [ElasticProperty(Name = "title")]        
        public string TitleNewName { get; set; }
        public DateTime PublishedDate { get; set; }
    }

然后我的弹性搜索代码

var res3 = elastic.Search<Blog, BlogListItem>(s => s
                .From(0)
                .Size(3)
                .Index(blogIndex)
                .Query(q => q.MatchAll())
                .Sort(o => o.OnField(p => p.PublishedDate))                   
                .Source(BlogListItem.Selector)
                );
            List<BlogListItem> resultList = res3.Hits.Select(hit => hit.Source).ToList();

现在这限制了返回的属性,所以我只得到Title,PublishedDate为null,我知道由于,我可以控制映射

[ElasticProperty(Name="title")]

仍然需要验证这是否是使用ElasticSearch的正确方法。

这就产生了以下Json

{
  "from": 0,
  "size": 3,
  "sort": [
    {
      "publishedDate": {}
    }
  ],
  "_source": {
    "include": [
      "title"      
    ]
  },
  "query": {
    "match_all": {}
  }
}

如何使用ElasticSearch只返回属性的子集

您的代码存在一些问题。

使用.Fields(BlogListItem.Selector)返回一个名为"publishedDate.title"的字段,这当然是错误的。我不知道如何使用Expression语法来提及字段,所以我不会尝试修复它。我通过打印请求JSON发现了这个错误。看看我对SO上另一个问题的回答,了解如何通过打印请求JSON来调试Nest查询。也许你可以使用这个技巧自己修复Expression语法:)

我使用我最熟悉的语法修复了Fields()

.Fields(f => f
    .Add(t => t.Title)
    .Add(t => t.PublishedDate)

即使使用此修复程序,您也会发现源代码是null。我们来讨论下一个问题。如果在搜索请求中提供"fields"选项,则"_source"将不会出现在响应命中中。这是Elasticsearch的行为,与Nest无关。在这种情况下,您必须依赖Fields.FieldValuesDictionary而不是Source:

var result = res.Hits.Select(e => e.Fields.FieldValuesDictionary).ToList();

然后,您可以根据上面的结果构建BlogListItem对象。