面向哈萨克语LVCSR的语言模型构建方法研究
- 作 者:
- 达吾勒·阿布都哈依尔; 努尔买买提·尤鲁瓦斯; 刘艳;
- 作者机构:
- 新疆大学信息科学与工程学院;
- 关键词:
- 语料库构建; 文本处理; 语言模型; 哈萨克语; 语音识别;
- 期刊名称:
- 计算机工程与应用
- i s s n:
- 1002-8331
- 年卷期:
- 2016 年 52 卷 24 期
- 页 码:
- 178-181
- 摘 要:
- 一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率。N-gram统计语言模型是目前广泛使用的语言模型之一。从文本的收集和处理开始,介绍了哈萨克语语言模型的构建相关技术,并以此为基础实现了一个哈萨克语连续语音识别基线系统。分别训练了基于单词和基于音节的3-gram语言模型,并通过困惑度及连续语言实验结果对两种语言模型进行了评价。
相关作者
相关机构
