您的位置: 首页 > 国内项目 > 详情页

基于潜在语义对偶空间的跨语言信息检索理论和算法研究
基金项目类型:
国家自然科学基金
基金项目编号:
60963014
来源网站:
国家自然科学基金委员会
来源网址:
http://www.nsfc.gov.cn/
负责人:
王明文
完成单位:
江西师范大学
中文关键词:
跨语言信息检索; 跨语言文本分类; 潜在语义对偶空间; 维数约简;
其他语种关键词:
Cross-language IR; Cross-language TC; Latent Semantic Dual Space; Dimension Reduction
项目类型:
地区科学基金项目
语种:
中文
开始日期:
2010-01-01
结束日期:
2012-12-31
中文摘要:
因特网资源的多语言性和用户对母语和非母语熟悉程度的差异性,使跨语言信息检索成为研究热点。在跨语言的信息检索和分类中,存在多词一义和一词多义、翻译歧义和数据高维性等问题。在检索模型中表现为特征的多重相关,进而影响模型检索性能;在分类模型中表现为自变量间的多重相关性、数据高维性,将影响文本分类性能。如何有效消除这些影响,成为提高跨语言的检索和分类性能的关键。本课题拟应用典型相关分析、偏最小二乘等统计理论研究新的模型,将多语言文档看成从不同侧面描述同一对象形成的不同视图,综合考虑语言的语义特性,通过构造潜在语义对偶空间,建立词的语义关系、文档的语义关系及其结构关系和双语间的语义对应关系;在该统一框架下研究基于潜在语义对偶空间的跨语言的检索模型、文本分类/聚类模型和维数约简方法;进一步研究基于潜在语义对偶空间的多语言信息检索模型,并在理论上证明和实验上验证新模型和方法的有效性。
相关组织者
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充