您的位置:
首页
>
国内项目
>
详情页
基于短语的维汉统计机器翻译关键技术的研究
- 基金项目类型:
- 国家自然科学基金
- 基金项目编号:
- 61063026
- 来源网站:
- 国家自然科学基金委员会
- 来源网址:
- http://www.nsfc.gov.cn/
- 负责人:
- 吐尔根.依布拉音
- 完成单位:
- 新疆大学
- 中文关键词:
-
双语平行语料库;
复杂形态语言;
维汉统计机器翻译;
- 其他语种关键词:
- Bilingual parallel corpus; Complex morphological language; Uyghur-Chinese statistical MT
- 项目类型:
- 地区科学基金项目
- 语种:
- 中文
- 开始日期:
- 2011-01-01
- 结束日期:
- 2013-12-31
- 中文摘要:
- 我国是一个统一的多民族国家。民族语言机器翻译的研究对维护我国民族地区的社会稳定和反对分裂活动、加强各民族交流、传承并发展民族文化、民族语言信息化技术的发展等都具有极为重要的意义。维吾尔语是我国使用人口最多的几个少数民族语言之一。维吾尔语属于维吾尔语属阿勒泰语系突厥语族,是一种复杂形态语言,复杂形态语言机器翻译建模是机器翻译研究面临的重要科学问题。本课题将以目前最先进的基于短语的维汉统计机器翻译技术的研究为基础着重研究解决制定维汉词语对齐规范、对数线性模型的维汉词对齐特征选取、非连续词语串中双语短语的抽取、短语相似度中形态信息影响度量等问题。最终目标是建立一个基于混合策略的维汉机器翻译系统。研究可以为将来面对对哈(哈萨克文)汉、乌(乌孜别克文)汉、柯(柯尔克孜)汉、土(土耳其文)汉机器翻译系统的开发打下坚实的基础.