您的位置: 首页 > 国内项目 > 详情页

Web页面数据对象的感知理解与计算
基金项目类型:
国家自然科学基金
基金项目编号:
61462010
来源网站:
国家自然科学基金委员会
来源网址:
http://www.nsfc.gov.cn/
负责人:
朱新华
完成单位:
广西师范大学
中文关键词:
语义对象; 概率主题模型; 图谱理论; 测度学习; 多粒度视图;
项目类型:
地区科学基金项目
语种:
中文
开始日期:
2015-01-01
结束日期:
2018-12-31
中文摘要:
Web页面数据的复杂异构一直是其高效处理的瓶颈,页面分块及信息抽取在一定程度上缓解了这一问题,但未能从根本上解决语义结构化问题。针对这一挑战性的问题,本项目拟以Web页面为研究对象,基于Web页面编撰语言特点,依据页面中信息内容及分布特征,利用统计学和信息科学相关理论和技术,研究Web页面数据对象的语义感知模型与方法,探索语义对象的测度学习理论和技术,构建跨粒度加权语义对象树模型,揭示语义对象到粒对象的关联映射机制,建立多粒度视图的Web页面表示及关联模型。具体研究内容包括:基于LDA模型的Web文本主题感知;基于谱聚类的短文本分类;基于视觉信息和信息内容的语义分块;Web页面语义对象测度学习;跨粒度加权语义对象树构造;Web页面多粒度表示与关联建模等。本项目所建立的Web页面数据感知理解与计算模型和方法,对Web信息集成管理、智能检索与分析挖掘等多个领域具有重要的理论意义和实用前景。
相关组织者
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充