lucene.net/examine weight html tags

本文关键字:html tags weight examine net lucene | 更新日期: 2023-09-27 18:21:58

我有一个项目,我们正在实施Examine/Lucene.net。我正在寻求你们的一些指导。

据我从谷歌的知识中了解到,如果我想增加体重,我需要在球场上增加体重,对吧?

但我能得到这样的东西吗:如果一个术语在h1标签或标题中,它能促进这个术语吗。当给出一个完整的网站html时,要经常做词条搜索。

我想做的是,不制作一个获取html文档的服务,通过该服务可以根据文本中使用的术语以及它们是否在重要位置(如标题标签或h2标签)找到该文档中的哪些单词进行优化。

这有可能实现吗?这样编辑们就可以知道,"他们写的东西最好用哪个搜索词找到

非常感谢。

lucene.net/examine weight html tags

我不认为它能以这种方式工作。是的,你可以提升一个字段,但不能根据它在某些标记中的位置来提升一个术语,因为你在搜索时并不知道这一点。

我认为您可以创建一个Umbraco事件处理程序,在发布页面时触发它。此事件可能:

  1. 利用索引的GatheringNodeData事件
  2. 获取基于富文本编辑器的字段的内容,并使用regex或类似HtmlUtility的东西根据其标记位置提取特定文本,例如H1、H2和H3文本。

  3. 对于找到的标题中的每一段文本,将其添加到字符串变量中

  4. 将整个字符串作为新字段添加到Lucene索引中,例如"Headings"
  5. 现在,您可以将"标题"字段单独提升为包含HTML字段的字段