基于CTC与Transformer的普通话单音节发音错误检测
- 作者机构:
- 新疆大学软件学院;
- 关键词:
- 语料库建设; 深度学习; 语音识别; 发音错误检测; TRANSFORMER;
- 期刊名称:
- 东北师大学报(自然科学版)
- i s s n:
- 年卷期:
- 2024 年 001 期
- 页 码:
- 87-95
- 摘 要:
- 提出CTC与Transformer结合的端到端模型,使用多编码器和字层级一致的方法,降低在复杂录制环境下的识别错误率.该端到端模型在自建数据集PSC_Monosyllable的测试集上的词错误率为5.6%.通过预训练,可以实现发音错误检测的正误分类,且比传统机器学习模型检测结果性能提升了16%,有效地提升了发音错误检出率,得出了较好的结果,检测率为0.589.
相关作者
相关机构
