一种基于特征模型的跨领域信息抽取方法
- 专利权人:
- 上海大学
- 发明人:
- 朱文浩,姚滕俊,胡冠男,金鑫,周资力
- 申请号:
- CN201710076390.4
- 公开号:
- CN106960002A
- 申请日:
- 2017.02.13
- 申请国别(地区):
- 中国
- 年份:
- 2017
- 代理人:
- 陆聪明
- 摘要:
- 本发明公开了一种基于特征模型的跨领域信息抽取方法。该方法分为多层次特征模型的建立、特征选择与组合以及反馈迭代机制三部分。引入了遗传算法并采用支持向量机进行交叉验证的特征空间生成算法,根据不同领域的原子特征,生成满足抽取任务要求的特征模型。它避免了传统Web信息抽取方法的领域适应度差的问题。大量的数值实验表明,与同类方法相比,该方法具有更高准确率和稳定性,并且算法本身有很好的可扩展性。
- 来源网站:
- 中国工程科技知识中心