教学Microsoft.语音引擎 一些非英语单词的发音

本文关键字:英语单词 Microsoft 语音 引擎 教学 | 更新日期: 2023-09-27 18:31:24

我正在使用Kinect开发一个c#应用程序,该应用程序依赖于语音输入来做事。我有一个阿拉伯语单词列表,用户可以说出这些单词来选择不同的菜单项。

在过去的几天里,我一直在寻找,但收效甚微。我发现的东西:

CMU狮身人面像:http://www.ccse.kfupm.edu.sa/~elshafei/AASR.htm这样做的第一个问题是它是基于java的。我看过KVM和桥,但我不能在这个东西上走得太远。我无法将其设置为在 Java 中工作。没有关于如何使用已准备好的文件的步骤。

我还查看了使用此链接建议的 SRGSdocument 在语音 API 中指定单词Microsoft发音但这对我来说太复杂了,我什至不知道这是否是我需要的。

我还看过Microsoft语音识别自定义训练这个人的问题很相似,但我不能以同样的方式解决我的问题。

我不能使用像Sakhr这样的商业应用程序,因为我没有预算。简单地在语法中添加单词是行不通的,因为这些单词不遵守英语的正常发音规则。

基本上,我正在寻找的是某种工具,可以将用英语编写的单词与来自麦克风的一组不同发音(如预训练)连接起来,然后可以在运行时由语音引擎引用。这可能吗?

我对任何选择都持开放态度。

谢谢。

教学Microsoft.语音引擎 一些非英语单词的发音

我认为您要做的是为识别器指定自定义词典。正如您所说,这将允许您"将用英语写的单词与一组不同的发音联系起来"。

该词典将书面单词映射到以音标书写的发音。可以使用自己的词典覆盖默认词典(如果使用英语识别器,则每个单词都有英语发音),方法是将新词典编写为 XML 文档,或者以内联方式指定单个发音。

因此,您可以将阿拉伯语单词的发音定义为一系列电话(我认为您只能使用英语中的电话,否则识别可能无法正常工作),然后将其链接到词典或内联中的英语书面单词(字素)。

本页解释了所有内容:关于词典和音标(Microsoft.语音)