需要语音识别方面的建议吗

本文关键字:方面 语音识别 | 更新日期: 2023-09-27 18:01:08

我开发了一个使用SAPI 5.1将语音转换为文本的应用程序。

由于准确性太弱,我决定创建自己的语法,我创建了自己的grammar,它只识别从1到10的数字。

我又一次在准确性上失败了。所以我深入研究了语法文件。我查阅了用于发音的词典文件。所以我的问题是

  1. 词典文件会改善精确这样我就可以使用数字1到10的发音在Lexicon文件中,然后使用它。

  2. 我需要一个关于如何以创建词典文件。

需要语音识别方面的建议吗

如果您的语音识别准确性较弱,可能是以下任何一个原因:

  1. 训练数据不足-请注意,创建一个依赖于说话者的语音识别系统(仅与一个说话者连接(需要每个单词的大量单位(在您的情况下为一到十个(。需要单独的单元来训练初始模型,然后可能需要嵌入的训练数据来进一步改进模型。

  2. 独立于说话者的语音识别模型将需要更多的数据。

  3. 测试数据和训练数据不匹配。如果模型是使用无噪声数据或带有重音的数据创建的,那么在使用具有大量噪声或不同重音的数据进行测试时,可能很难获得良好的结果。

但是,更多关于你正在尝试建立的语音识别系统的细节会更好。

更新1:由于您在评论中提到您正在使用Microsoft Speech SDK,因此这里有一个关于声音/重音的语音SDK培训指南。只要按照指示去做,你就可以上路了。