2013年最佳Lucene搜索平台:Solr或ElasticSearch

本文关键字:Solr ElasticSearch 平台 最佳 Lucene 搜索 2013年 | 更新日期: 2023-09-27 18:11:11

我经营一个招聘板(PostJobFree.com),上面有大约100万份简历。平均简历大小约为4000字节。PostJobFree使用ASP。. net/c#/SQL Server 2008 R2和MS SQL全文检索

通过阅读各种文章,我相信切换到Apache Lucene搜索将使搜索更快,更具可扩展性。但是我从来没有试过。

问题1:从MS SQL全文搜索切换到Apache Lucene大约1M文档标记是正确的选择,或者我不会注意到显著的搜索速度提高吗?我预计数据库中可搜索文档的数量每月增长10%。

问题2:什么是最好的Lucene平台:Solr还是ElasticSearch?

以下是我目前的发现:

1。Google搜索趋势http://www.google.com/trends/explore#q=elasticsearch%20search%2C%20solr%20search%2C%20sphinx%20search%2C%20%22sql%20server%22%20%22full-text%20search%22&cmpt=q截至目前(2013年4月)

    Solr似乎是目前最流行的搜索平台,但Solr的受欢迎程度在去年(2012年4月)根本没有增长- 2013年4月)。
  • ElasticSearch从,但仍然只有Solr的40%左右。
  • Sphinx搜索在2006-2009年流行起来,从2008年开始下降2009年。现在它和ElasticSearch一样流行。
  • SQL Server全文检索长期下降

这些趋势与这些搜索平台的质量相关吗?

2。过去的StackOverflow问题

StackOverflow在2010年2月有搜索平台比较问题:ElasticSearch, Sphinx, Lucene, Solr, Xapian。哪个适合哪个用法?

它的创造者Shay Banon的"ElasticSearch"答案是当时最受欢迎的。

类似的问题在2012年末被问到:Solr vs. ElasticSearch

最受欢迎的答案还是支持ElasticSearch。

3。其他

Nick Zadrosny(同时运营Solr托管服务websolr.com和ElasticSearch托管服务bonsaio)在2012年4月是ElasticSearch的支持者:https://news.ycombinator.com/item?id=3833735

这是Nick今天(2013年4月)的回答:

Elasticsearch确实倾向于更适合初学者Solr。Elasticsearch有一个更好的API,当然也更容易设置并为新应用程序进行配置。也就是说,Solr仍然有一些在成熟度和健壮性方面的优势,以及学习曲线当你不需要担心生产的时候,这也不算太不合理配置。除此之外,两者在Lucene中都有相同的根源提供类似的功能。两者都应该同样适用于你的需求。

我想知道"稳健性"究竟是什么意思,以及这种稳健性的差异在未来几年将如何变化?

4。渗流

ElasticSearch有渗透功能,应该允许我实现简历搜索警报与即时交付。Solr有类似的东西吗?

2013年最佳Lucene搜索平台:Solr或ElasticSearch

这是一个非常主观/本地化的问题,我将贡献我自己的投票来结束这样的问题,但我将尝试回答,因为我在问题中被引用了。

Solr总是有很多遗留的接口和api需要支持,但它是众所周知的,并且得到了很好的证明。Elasticsearch的全新开始为开发人员提供了卓越的体验,特别是对于初学者来说,但它仍然有成长和成熟的空间。

两者之间的决定是高度主观的。我目前的建议是:如果你有疑问,从Elasticsearch开始。如果以后的环境需要切换,您在这里学到的概念可以很好地转换到Solr。

除此之外,评估生态系统的其余部分。例如针对特定编程语言的教程、文档和高质量的开源客户机的可用性和质量。或者是否有托管提供商、顾问和商业支持合同。

最终,我非常认为Solr和Elasticsearch都在朝着相同的目标努力,争夺相同的用户群,并将在功能对等的类似水平上收敛。

正如Nick所说,我会说给他们一个尝试。几分钟后,应该就很清楚了。

当我在2011年发现Elasticsearch时,很明显这个项目将成为一个主要项目。这就是现在正在发生的事情。我在2011年夏天开始在生产中使用它。非常稳定。

免责声明:我现在在elasticsearch.com工作,但我几个月前就会给你同样的答案!