基于中文语义?音韵信息的语音识别文本校对模型
- 作者机构:
- 燕山大学信息科学与工程学院;
- 关键词:
- 注意力机制; 文本校对; 拼音; 语音识别;
- 期刊名称:
- 通信学报
- i s s n:
- 1000-436X
- 年卷期:
- 2022 年 43 卷 011 期
- 页 码:
- 65-79
- 摘 要:
- 为了研究拼音对检测和纠正语音识别文本错误的影响,提出了一种基于中文语义?音韵信息的文本校对模型.定义了5种拼音编码方法构建字符?音韵嵌入向量,以此作为基于GRU的Seq2Seq模型的输入,并应用注意力机制提取语句的语义?音韵信息来校对语音识别文本错误.针对标注语料不足的问题,提出了一种基于拼音声韵置换的数据增强方法.在AISHELL-3公开数据集的实验结果表明,拼音携带的音韵信息有利于校对语音识别文本错误,所提方法可提升模型的检错性能.
相关作者
相关机构
