您的位置: 首页 > 中文期刊论文 > 详情页

融合先验信息的蒙汉神经网络机器翻译模型

作   者:
樊文婷侯宏旭王洪彬武静李金廷
作者机构:
内蒙古大学计算机学院
关键词:
重现神经网络未登录词词性标注词向量
期刊名称:
中文信息学报
基金项目:
跨汉斯拉夫蒙古文的信息检索关键技术研究
i s s n:
1003-0077
年卷期:
2018 年 06 期
页   码:
36-43
摘   要:
神经网络机器翻译模型在蒙古文到汉文的翻译任务上取得了很好的效果。神经网络翻译模型仅利用双语语料获得词向量,而有限的双语语料规模却限制了词向量的表示。该文将先验信息融合到神经网络机器翻译中,首先将大规模单语语料训练得到的词向量作为翻译模型的初始词向量,同时在词向量中加入词性特征,从而缓解单词的语法歧义问题。其次,为了降低翻译模型解码器的计算复杂度以及模型的训练时间,通常会限制目标词典大小,这导致大量未登录词的出现。该文利用加入词性特征的词向量计算单词之间的相似度,将未登录词用目标词典中与之最相近的单词替换,以缓解未登录词问题。最终实验显示在蒙古文到汉文的翻译任务上将译文的BLEU值提高了2.68个BLEU点。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充