在c#或c++中搜索另一个音频中的音频

本文关键字:音频 另一个 搜索 c++ | 更新日期: 2023-09-27 18:09:15

假设有一个示例音频文件,其中包含最多10个简单单词

"一二三....十"

,并且音频文件中的每个数字之间有1秒的沉默。

例如,我想检查音频文件是否包含关键字"Two"。请注意,我有关键字"二"语音文件,它是完全相同的声音从主语音文件,但它可能包含一些噪音。

是否有一种方法可以让我在更大的音频文件中搜索语音"二"并找到发生时间?

在c#或c++中搜索另一个音频中的音频

由于没有提供代码,我只是给你一个如何进行的想法,希望它会有所帮助。

首先,你必须根据沉默将文件拆分为10个不同的音频文件(我相信有库可以帮助你做到这一点)。

然后你可以将文件发送到google语音识别api,并获得一个字符串作为结果,该字符串将根据文件中的声音包含字符串。

编辑:请参考:https://googlespeechtotext.codeplex.com/

如何使用谷歌语音识别api在c#?

你为什么不把这两个音频样本都转换成一些比特或信号格式,并检查它们是否都有一些共同的字符串呢?

在进一步研究。net中的音频之前,你应该检查一些链接:

http://crsouza.com/2009/08/converting-audio-bit-depths-in-c/
https://cscore.codeplex.com/
http://www.codeproject.com/Articles/501521/How-to-convert-between-most-audio-formats-in-NET

让我知道你是否能解决这个问题。