如何在c#中快速检查大数据

本文关键字:检查 数据 | 更新日期: 2023-09-27 17:49:27

我有一个20000 - 50000字的列表。我有几页的文本,比如1000字。我想检查这1000个单词中的每一个是否都在我的大列表中,并计算匹配情况,但逐个检查单词太麻烦而且没有必要。我想现实生活中的字典是最快的,在那里你可以查几次就找到你要找的单词。我是对的吗?如何做到这一点/最好的方法是什么?

我想使用sqlite和一些查询

如何在c#中快速检查大数据

我想真正的生活字典是最快的,你可以在几次检查中找到你要找的单词。

这实际上是一个很好的例子。想象一下,除了字母表之外,你对字典里的语言一无所知。你仍然可以很快找到这个词。如何?

  • 检查中间的某个地方。这个词是在你选的词之前还是之后?删除字典中不匹配的那一半。
  • 检查剩余值的中间位置…
  • 重复…

这叫做二分查找。而且,它确实非常快。它只需要一个先决条件……该列表必须排序。

如果你的列表是有序的,你可以利用这个机会来熟悉计算机科学的基本算法之一,二分搜索。几乎每种编程语言都有大量的示例,甚至可能有内置的工具和数据类型供您使用。(例如,我想象SortedList将在内部实现二进制搜索,当您在其中引用值时。