您的位置: 首页 > 中文期刊论文 > 详情页

基于维基百科的领域概念语义知识库的自动构建方法

作   者:
张巧燕林民张树钧
作者机构:
内蒙古师范大学计算机与信息工程学院
关键词:
随机游走语义相似度计算关键词抽取维基百科语义知识库
期刊名称:
计算机应用研究
基金项目:
面向中文口语理解的非参数贝叶斯分析方法的研究和应用
面向动态领域文本复杂标签结构语义标注的监督主题模型扩展及算法研究
i s s n:
1001-3695
年卷期:
2018 年 01 期
页   码:
130-134+139
摘   要:
针对为检索服务的语义知识库存在的内容不全面和不准确的问题,提出一种基于维基百科的软件工程领域概念语义知识库的构建方法。以SWEBOK V3概念为标准,从维基百科提取概念的解释文本,并抽取其关键词表示概念的语义;通过概念在维基百科中的层次关系、概念与其他概念的解释文本关键词之间的链接关系、不同概念解释文本关键词之间的链接关系构成概念语义知识库;利用LDA主题模型分别与TF-IDF、Text Rank算法相结合的两种方法抽取关键词;对构建好的概念语义知识库用随机游走算法计算概念间的语义相似度。将实验结果与人工标注结果对比后发现,本方法构建的语义知识库语义相似度准确率能够达到84%以上,充分验证了所提方法的有效性。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充