您的位置:
首页
>
中文期刊论文
>
详情页
基于图卷积编码器的蒙汉神经机器翻译
- 作 者:
-
薛媛;
苏依拉;
仁庆道尔吉;
石宝;
李雷孝;
- 作者机构:
-
内蒙古工业大学信息工程学院;
- 关键词:
-
蒙汉机器翻译;
依存句法树;
字节对编码;
图卷积编码;
- 期刊名称:
- 计算机应用与软件
- i s s n:
- 1000-386X
- 年卷期:
-
2023 年
010 期
- 页 码:
- 70-75,89
- 摘 要:
-
基于神经网络模型的蒙汉机器翻译严格采用编码器-解码器的序列建模方式,不能有效利用句法信息以及语言的层次结构信息。为将句法结构信息融入蒙汉机器翻译以提高其翻译性能,提出在源语言端采用双编码器,同时对源句和由源句解析而来的句法依存树进行编码;由于蒙汉机器翻译中经常会出现未登录词问题,因此将使用字节对编码技术预处理蒙古语。为解决机器翻译中的过度矫正问题,在训练阶段,模型以一定的概率从正确标注的序列中和预测生成的序列中采样上下文单词。在120万蒙汉平行语料的实验中证明,该方法相较于传统的BiRNN和CNN,BLEU值分别提高了2.69和2.09。
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...