检查录音质量的有效方法

本文关键字:有效 方法 录音 检查 | 更新日期: 2023-09-27 18:27:47

我们有来自实时非受控录制的各种波形文件,这些文件来自我们的一个服务器端进程,其中大多数文件始终具有良好的清晰语音。然而,有时它们是混乱的,它们有静电,或者音量不够大。是否有一种有效的方法来确定使用C#的记录是否被认为是"良好"质量?

我想过把一个已知好录音的频谱图与一个坏录音的频谱进行比较,但每次录音都会有不同的语音,所以这可能不起作用。我研究过像Bass.Net和NAudio这样的库,但音频处理不是我的专业领域。

我可以尝试比较音频指纹,但我不完全确定这是如何工作的。我看到有人试图使用他们的音频指纹哈希和Levenstein距离算法来比较两个音频文件,以找出两个音频档案之间的相似程度。除非音频指纹生成的哈希在相似的音频文件之间相似,否则这种方法是行不通的。

我的另一个想法是使用某种语音识别API来处理语音,并将音频记录写入文本文件。问题是语音识别不是非常准确,像微软的speech API这样的API可能仍然试图识别语音,即使是在混乱的录音或带有大量静态的录音中。我看到Nuance有他们语音识别软件的SDK版本,但我还没有机会查看SDK,因为他们的网站上似乎没有提供SDK的试用版。

检查录音质量的有效方法

您可以使用现有的开源工具来测量噪声语音的信噪比。有关详细信息,请参阅http://labrosa.ee.columbia.edu/projects/snreval/

我建议你试试WADA SNR

http://www.cs.cmu.edu/~健壮/存档/算法/WADA_SNR_IS_2008/

这是一个非常简单的算法,但自己设计它并非易事。

指纹和ASR不能确定工作,因为它们试图消除噪声而不是检测到噪声。

我也在寻找类似问题的解决方案,我发现了这个开源项目:https://github.com/dpwe/audfprint.你可以创建一个数据库,然后将你的查询(你不确定的音频质量)与数据库进行比较。