一种基于成词率适应度函数的新词识别免疫遗传方法
- 专利权人:
- 北京理工大学
- 发明人:
- 史树敏,史胜清,黄河燕,周新宇
- 申请号:
- CN201610532187.9
- 公开号:
- CN106202043A
- 申请日:
- 2016.07.04
- 申请国别(地区):
- 中国
- 年份:
- 2016
- 代理人:
- 摘要:
- 一种基于成词率适应度函数的新词识别免疫遗传方法,属于自然语言信息处理应用领域。本发明首先根据网络新词的特点,提取共同语素,将共同语素和独词作为免疫遗传方法中的示范性抗体,然后利用成词率设计合适的适应度函数,并在适应度函数中加入调节参数,以优化最终实验结果,最后对由免疫遗传方法识别出的候选词用新闻语料进行处理,得到最终的网络新词。对比现有技术,本发明针对网络新词的特点,设计适合网络新词识别的适应度函数,充分考虑网络新词长度,单字和字串所占比例等因素,并将字串的频数信息加入适应度函数的设计中,从而提高了网络新词发现的正确率、召回率和F值。
- 来源网站:
- 中国工程科技知识中心