什么是“帧阻塞”?的意思

本文关键字:意思 帧阻塞 什么 | 更新日期: 2023-09-27 18:02:14

我对"帧块"很好奇,这是我在网站上看到的特征提取的第一步。它说音频的特征提取应该遵循以下步骤:

  1. 帧阻塞
  2. 窗口
  3. fft
  4. mel-frequency翘曲
  5. 倒频谱

"帧阻塞"是什么意思?谁能给出一个算法或代码(c#)吗?

顺便问一下,这个步骤顺序对特征提取是正确的吗?

在特征提取之前,我应该做什么作为"预过滤"音频?

谢谢。

什么是“帧阻塞”?的意思

这是我在谷歌上搜索到的术语,"帧阻塞"-谷歌自动完成为"语音信号的帧阻塞"。

http://books.google.com/books?id=B9VuCBBYzJ4C& pg = PA21&液化石油气= PA21& dq =框架+阻断+ +演讲+ signal&源= bl& ots = FCzp86g8F0&团体= P5aolL4OAAyPwxZ2nMd-Ye_5M_I& hl = en& sa = X& ei = oLM3UeK3DsTfrQHyvYD4DQ& sqi = 2, ved = 0 cc4q6aewaa # v = onepage& q = % 20帧阻止% 20 % 20的演讲% 20 signal& f = false

相关文本:

语音信号处理中最常见的方法是基于短时分析。预先强调的信号被阻塞成N采样帧。帧持续时间通常在10 - 30毫秒之间。这个范围内的值代表了频谱变化率和系统复杂性之间的权衡。适当的帧持续时间最终取决于语音生成系统中发音器的速度。一些声音(例如,停止辅音)表现出尖锐的频谱过渡,这可能导致频谱峰移动高达80 Hz/msec (Mar76)。图2.3演示了在J帧中阻塞单词的情况。重叠的数量在某种程度上控制着参数从一帧到另一帧的变化速度。

现在你的问题是,你在帧阻塞方面做了什么尝试?