您的位置:
首页
>
国内项目
>
详情页
面向中文指称概念的知识获取方法研究
- 基金项目类型:
- 国家自然科学基金
- 基金项目编号:
- 61203284
- 来源网站:
- 国家自然科学基金委员会
- 来源网址:
- http://www.nsfc.gov.cn/
- 负责人:
- 王石
- 完成单位:
- 中国科学院计算技术研究所
- 中文关键词:
-
指称概念语义分析;
隐喻发现;
知识获取;
自然语言理解;
- 其他语种关键词:
- nominal concept semantic analysis; metaphor detection; knowledge discovery; natural language processing
- 项目类型:
- 青年科学基金项目
- 语种:
- 中文
- 开始日期:
- 2013-01-01
- 结束日期:
- 2015-12-31
- 中文摘要:
- 指称概念内部蕴含着丰富的知识,由于这些知识具有常识性和高压缩性,基于语料库的方法在获取时遇到了困难。本课题在已构建的大规模中文指称概念库和上下位知识库基础上,研究从指称概念内部获取语义关系的新方法,是对大规模知识库建设的有益补充。首先,结合上下位知识库和语料库度量概念间的语义结构相似性,监督学习指定类型的语义关系,并用语义规则进行知识验证。其次,采用软层次聚类方法,非监督学习指称概念内未指定类型的语义关系,并用词汇-句法模式方法自动分析其元性质,辅助人工关系命名并最终建立层次性的语义关系分类体系。最后,借助于中文指称概念的构词规律,利用后缀频率统计特征和语义验证规则,从指称概念中获取后缀型上下位关系,并基于隐喻词汇和语境特征识别和排除隐喻型上下位。在研究上,本课题可为自然语言深层语义分析这一难题提供思路。在应用中,本方法可结合面向语料库的知识获取系统,建设大规模知识库,为智能系统提供资源。