基于常Q变换与深度神经网络的VDR语音端点检测
- 作者机构:
- 浙江理工大学信息电子学院; 大连海事大学信息科学技术学院;
- 关键词:
- 船舶航行数据记录仪(VDR); 常Q变换(CQT); 深度神经网络(DNN); 语音端点检测(VAD);
- 期刊名称:
- 大连海事大学学报
- i s s n:
- 1006-7736
- 年卷期:
- 2022 年 002 期
- 页 码:
- 128-135
- 摘 要:
- 基于采集的真实船舶航行数据记录仪音频数据,提出一种基于常Q变换(Constant-Q Transform, CQT)幅度谱与深度神经网络(DNN)的语音端点检测方法。为获得适合不同频段的变频率分辨率,采用CQT对VDR音频信号进行谱分析,并利用DNN自动学习基于CQT幅度谱的复杂特征表示,实现端到端的VDR音频数据语音端点检测,真实VDR音频数据验证了本文方法的有效性。实验结果表明,该方法具有较高的正确率和鲁棒性。
相关作者
相关机构
