您的位置:
首页
>
国内项目
>
详情页
Web页面数据对象的感知理解与计算
- 基金项目类型:
- 国家自然科学基金
- 基金项目编号:
- 61462010
- 来源网站:
- 国家自然科学基金委员会
- 来源网址:
- http://www.nsfc.gov.cn/
- 负责人:
- 朱新华
- 完成单位:
- 广西师范大学
- 中文关键词:
-
语义对象;
概率主题模型;
图谱理论;
测度学习;
多粒度视图;
- 项目类型:
- 地区科学基金项目
- 语种:
- 中文
- 开始日期:
- 2015-01-01
- 结束日期:
- 2018-12-31
- 中文摘要:
- Web页面数据的复杂异构一直是其高效处理的瓶颈,页面分块及信息抽取在一定程度上缓解了这一问题,但未能从根本上解决语义结构化问题。针对这一挑战性的问题,本项目拟以Web页面为研究对象,基于Web页面编撰语言特点,依据页面中信息内容及分布特征,利用统计学和信息科学相关理论和技术,研究Web页面数据对象的语义感知模型与方法,探索语义对象的测度学习理论和技术,构建跨粒度加权语义对象树模型,揭示语义对象到粒对象的关联映射机制,建立多粒度视图的Web页面表示及关联模型。具体研究内容包括:基于LDA模型的Web文本主题感知;基于谱聚类的短文本分类;基于视觉信息和信息内容的语义分块;Web页面语义对象测度学习;跨粒度加权语义对象树构造;Web页面多粒度表示与关联建模等。本项目所建立的Web页面数据感知理解与计算模型和方法,对Web信息集成管理、智能检索与分析挖掘等多个领域具有重要的理论意义和实用前景。