您的位置: 首页 > 中文期刊论文 > 详情页

融合多教师模型的知识蒸馏文本分类

作   者:
苑婧周杨胡校飞孙姝娅张呈龙刘龙辉
作者机构:
战略支援部队信息工程大学华北水利水电大学
关键词:
XLNetBiGRU-CNN知识蒸馏BERT-wwm-ext文本分类
期刊名称:
电子技术应用
i s s n:
0258-7998
年卷期:
2023 年 49 卷 011 期
页   码:
42-48
摘   要:
针对简单文本分类模型精度不高,预训练模型结构复杂,在实际环境中难以直接使用的问题,提出多教师知识蒸馏的文本分类方法.该模型使用"教师-学生网络"的训练方法,教师模型为BERT-wwm-ext和XLNet预训练模型,将两个模型输出的概率矩阵通过权重系数融合为软标签.学生模型为BiGRU-CNN网络,使用均方差函数计算软标签误差,使用交叉熵损失函数计算硬标签误差,通过硬标签和软标签训练学生模型使损失函数值达到最小.实验结果表明,提出的方法精度较学生模型有较大的改进,接近预训练模型,在保证分类精度的前提下减少了运行时间,提高了效率.
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充