检查录音质量的有效方法

本文关键字：有效方法录音检查 | 更新日期: 2023-09-27 18:27:47

我们有来自实时非受控录制的各种波形文件，这些文件来自我们的一个服务器端进程，其中大多数文件始终具有良好的清晰语音。然而，有时它们是混乱的，它们有静电，或者音量不够大。是否有一种有效的方法来确定使用C#的记录是否被认为是"良好"质量？

我想过把一个已知好录音的频谱图与一个坏录音的频谱进行比较，但每次录音都会有不同的语音，所以这可能不起作用。我研究过像Bass.Net和NAudio这样的库，但音频处理不是我的专业领域。

我可以尝试比较音频指纹，但我不完全确定这是如何工作的。我看到有人试图使用他们的音频指纹哈希和Levenstein距离算法来比较两个音频文件，以找出两个音频档案之间的相似程度。除非音频指纹生成的哈希在相似的音频文件之间相似，否则这种方法是行不通的。

我的另一个想法是使用某种语音识别API来处理语音，并将音频记录写入文本文件。问题是语音识别不是非常准确，像微软的speech API这样的API可能仍然试图识别语音，即使是在混乱的录音或带有大量静态的录音中。我看到Nuance有他们语音识别软件的SDK版本，但我还没有机会查看SDK，因为他们的网站上似乎没有提供SDK的试用版。

检查录音质量的有效方法

您可以使用现有的开源工具来测量噪声语音的信噪比。有关详细信息，请参阅http://labrosa.ee.columbia.edu/projects/snreval/

我建议你试试WADA SNR

http://www.cs.cmu.edu/~健壮/存档/算法/WADA_SNR_IS_2008/

这是一个非常简单的算法，但自己设计它并非易事。

指纹和ASR不能确定工作，因为它们试图消除噪声而不是检测到噪声。

我也在寻找类似问题的解决方案，我发现了这个开源项目：https://github.com/dpwe/audfprint.你可以创建一个数据库，然后将你的查询（你不确定的音频质量）与数据库进行比较。