您的位置:
首页
>
中文期刊论文
>
详情页
融合先验信息的蒙汉神经网络机器翻译模型
- 作 者:
-
樊文婷;
侯宏旭;
王洪彬;
武静;
李金廷;
- 作者机构:
-
内蒙古大学计算机学院;
- 关键词:
-
重现神经网络;
未登录词;
词性标注;
词向量;
- 期刊名称:
- 中文信息学报
- 基金项目:
-
跨汉斯拉夫蒙古文的信息检索关键技术研究
- i s s n:
- 1003-0077
- 年卷期:
-
2018 年
06 期
- 页 码:
- 36-43
- 摘 要:
-
神经网络机器翻译模型在蒙古文到汉文的翻译任务上取得了很好的效果。神经网络翻译模型仅利用双语语料获得词向量,而有限的双语语料规模却限制了词向量的表示。该文将先验信息融合到神经网络机器翻译中,首先将大规模单语语料训练得到的词向量作为翻译模型的初始词向量,同时在词向量中加入词性特征,从而缓解单词的语法歧义问题。其次,为了降低翻译模型解码器的计算复杂度以及模型的训练时间,通常会限制目标词典大小,这导致大量未登录词的出现。该文利用加入词性特征的词向量计算单词之间的相似度,将未登录词用目标词典中与之最相近的单词替换,以缓解未登录词问题。最终实验显示在蒙古文到汉文的翻译任务上将译文的BLEU值提高了2.68个BLEU点。
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...