我必须“调整”一些我上课的录音。教授在这里走来走去,但我的录音机在固定的地方。现在我有从大声到低语的音轨。我如何使用ffmpeg处理它?
有几种可能性:
应用简单的归一化(例如,峰值或RMS归一化)。这只会改变整个文件的增益,因此您仍然会在响亮和柔和的部分之间遇到变化。并非真正推荐用于您的用例。
对compand
过滤器使用动态压缩。这将在整个录制过程中减小动态范围(即,柔和声部之间的差异)。您必须找到一个合适的阈值来开始压缩,并且很可能会收到有关软声部的相当嘈杂的信号。
使用dynaudnorm
过滤器,该过滤器“允许在音频的“安静”部分施加额外的增益,同时避免失真或剪切“大声”部分。” 在您的情况下,那将是首选。
基本上,您只需要从此处下载ffmpeg的最新静态版本,然后运行:
ffmpeg -i input.wav -filter:a "dynaudnorm" output.wav
您很可能需要针对特定用例调整过滤器选项。使用为compand
过滤器提供的示例作为起点:
使音乐既安静又响亮,适合在嘈杂的环境中聆听:
compand=.3|.3:1|1:-90/-60|-60/-40|-40/-30|-20/-20:6:0:-90:0.2
带有耳语和爆炸声的音频的另一个示例:
compand=0|0:1|1:-90/-900|-70/-70|-30/-9|0/-3:6:0:0:0
这里,第二个示例的选项特别是:
attacks=0|0
decays=1|1
points=-90/-900|-70/-70|-30/-9|0/-3
soft-knee=6
gain=0
volume=0
delay=0
您可以调整增益以保持相同的动态处理,但将其调整为基准输入水平。
另外,作为ffmpeg的图形替代,您可以使用Audacity及其内置的压缩器,该功能与compand
ffmpeg中的过滤器具有相同的效果。维基也对这些选项有很好的解释。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句