您的位置: 首页 > 外文期刊论文 > 详情页

卫星领域语料库构建与命名实体识别

作   者:
徐聪石会鹏陈志敏张鑫宇王静杨甲森
作者机构:
中国科学院国家空间科学中心复杂航天系统电子信息技术重点实验室
关键词:
数据稀缺命名实体识别迁移学习神经网络
期刊名称:
国防科技大学学报
i s s n:
年卷期:
2024 年 004 期
页   码:
175-183
摘   要:
针对卫星领域命名实体语料匮乏、现有算法识别性能较低的问题,提出一种考虑模糊边界的卫星领域实体标注方法,构建包含8类常见卫星领域实体的语料库,与该领域现有语料库相比粒度更细、覆盖更广,并以此为基础提出迁移学习和多网络融合的卫星领域实体识别算法.该算法采用预训练双向编码器对语料语义平滑迁移获得子词级别特征,采用双向长短期记忆(bi-directional long-short term memory,BiLSTM)神经网络捕捉上下文信息确定边界,以条件随机场作为解码器实现标签预测.实验结果表明:相比于BiLSTM等传统模型具有更优的识别性能,算法在8种实体上的F1值均在92%以上,微平均F1值达到96.10%.
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充