用html存储文档到弹性搜索

本文关键字:搜索 文档 html 存储 | 更新日期: 2023-09-27 18:09:01

我试图剥离出html后的一些内容索引弹性搜索。我找不到合适的例子。

我看过这个:

http://elasticsearch-users.115913.n3.nabble.com/Strip-HTML-on-indexing-does-not-store-results-td3039614.html

这:https://github.com/elastic/elasticsearch/issues/1026

无随访。我的问题是,我应该在索引之前剥离html,还是有一些自定义的弹性搜索来完成这项工作?

用html存储文档到弹性搜索

可以使用html条形过滤器。它确保你只搜索HTML的文本(而不是div或body标签文本),并返回HTML作为结果