预定义文本的 .NET 语音识别

本文关键字:语音识别 NET 文本 预定义 | 更新日期: 2023-09-27 18:31:35

我正在开发一个应用程序,用户在其中阅读一些预定义的文本,我们使用语音识别引擎来记录他说的话。然后我们将结果与预定义的文本进行比较,以找到他正在阅读的句子或文本的一部分。

我们使用Nuance NDev作为我们的语音识别引擎,但现在成本太高,我们正试图找到另一种选择。

所以我正在试验 .NET 语音识别引擎,但我无法找到实现此目的的方法。

从我的测试中:

  • 听写语法很好,因为它可以翻译用户说的每个单词,但结果真的很混乱,所以几乎不可能找到匹配项。

  • GrammarBuilder和Choises类的混合更像是一个命令=>动作类型的东西,它不会翻译用户所说的所有单词,它只是搜索一个特定的单词/命令并打印它。

所以我想知道的是,是否有一种方法可以像行为一样获得听写的语法,但只能使用单词的子集,例如我预定义文本中的所有单词,或者让我设置单词/句子以帮助识别引擎的东西。

例如,如果我给引擎这个预定义的文本:

一天早上,当格雷戈尔·萨姆萨从烦恼的梦中醒来时,他发现自己在床上变成了一只可怕的害虫。他躺在盔甲般的背上,如果他稍微抬起头,他可以看到他棕色的腹部,略微圆顶,被拱门分成僵硬的部分。

它只能从此文本中返回单词。因此,识别将更容易,更准确。

如果您对如何实现此或任何其他替代方案有任何想法,我都会听到。唯一的限制是它必须支持英语法语

谢谢。

预定义文本的 .NET 语音识别

一种选择是通过互操作 C# 绑定尝试 CMUSphinx 的 pocketsphinx 引擎。它允许您指定从文本编译的语言模型,然后它将准确地检测单词。

提供法语和英语型号。