需要语音识别方面的建议吗

本文关键字：方面语音识别 | 更新日期: 2023-09-27 18:01:08

我开发了一个使用SAPI 5.1将语音转换为文本的应用程序。

由于准确性太弱，我决定创建自己的语法，我创建了自己的grammar，它只识别从1到10的数字。

我又一次在准确性上失败了。所以我深入研究了语法文件。我查阅了用于发音的词典文件。所以我的问题是

需要语音识别方面的建议吗

如果您的语音识别准确性较弱，可能是以下任何一个原因：

训练数据不足-请注意，创建一个依赖于说话者的语音识别系统(仅与一个说话者连接(需要每个单词的大量单位(在您的情况下为一到十个(。需要单独的单元来训练初始模型，然后可能需要嵌入的训练数据来进一步改进模型。
独立于说话者的语音识别模型将需要更多的数据。
测试数据和训练数据不匹配。如果模型是使用无噪声数据或带有重音的数据创建的，那么在使用具有大量噪声或不同重音的数据进行测试时，可能很难获得良好的结果。

但是，更多关于你正在尝试建立的语音识别系统的细节会更好。

更新1：由于您在评论中提到您正在使用Microsoft Speech SDK，因此这里有一个关于声音/重音的语音SDK培训指南。只要按照指示去做，你就可以上路了。