我有一个任务:确定声源位置。
我有一些使用tensorflow
,对一些简单的特征和数据集进行预测的经验。我假设对于这项任务,有必要分析声频以及可能的其他有关训练和预测步骤的相关数据。声音来自耳机,因此人耳能够检测到方向。
1)有人已经这样做了吗?(不幸的是找不到任何类似的项目)
2)在尝试实现这一目标时我会遇到什么样的警告?
3)我可以使用这种技术方法做到这一点吗?有没有其他声音处理框架/技术/开源项目可以帮助我?
我在这里问这个问题,因为我在 google、github、stackoverflow 上的研究没有向我显示关于该特定主题的任何相关结果,因此非常感谢任何帮助!
这通常通过具有多个传感器的更传统的 DSP 来完成。您可能想要查看到达时间差 (TDOA) 和到达方向 (DOA)。GCC-PHAT 和 MUSIC 等算法会有所帮助。
您可能会遇到的问题是: DOA 精度是源的直接混响比的函数,即环境的混响越多,确定源位置就越困难。
此外,您可能还需要考虑要解析的位置维度数。3D 空间中的一个点比相对于传感器的方向要困难得多
使用机器学习作为解决此问题的方法并非完全没有价值,但您必须考虑您将学习的是什么,即您可能不想学习测试室的混响属性,而是想要学习传感器的空间属性。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句