您的位置: 首页 > 外文期刊论文 > 详情页

基于Transformer的多子空间多模态情感分析

作   者:
田昌宁贺昱政王笛万波郭栩彤
作者机构:
西安电子科技大学计算机科学与技术学院中国电子科技集团公司第五十四研究所
关键词:
多模态情感分析多子空间Transformer结构多头注意力机制
期刊名称:
西北大学学报(自然科学版)
i s s n:
1000-274X
年卷期:
2024 年 54 卷 002 期
页   码:
156-167
摘   要:
多模态情感分析是指通过文本、视觉和声学信息识别视频中人物表达出的情感.现有方法大多通过设计复杂的融合方案学习多模态一致性信息,而忽略了模态间和模态内的差异化信息,导致缺少对多模态融合表示的信息补充.为此提出了一种基于Trans-former 的多子空间多模态情感分析(multi-subspace Transformer fusion network for multimo-dal sentiment analysis,MSTFN)方法.该方法将不同模态映射到私有和共享子空间,获得不同模态的私有表示和共享表示,学习每种模态的差异化信息和统一信息.首先,将每种模态的初始特征表示分别映射到各自的私有和共享子空间,学习每种模态中包含独特信息的私有表示与包含统一信息的共享表示.其次,在加强文本模态和音频模态作用的前提下,设计二元协同注意力跨模态Transformer模块,得到基于文本和音频的三模态表示.然后,使用模态私有表示和共享表示生成每种模态的最终表示,并两两融合得到双模态表示,以进一步补充多模态融合表示的信息.最后,将单模态表示、双模态表示和三模态表示拼接作为最终的多模态特征进行情感预测.在2个基准多模态情感分析数据集上的实验结果表明,该方法与最好的基准方法相比,在二分类准确率指标上分别提升了0.025 6/0.014 3 和 0.000 7/0.002 3.
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充