基于多语言模型词汇增强的低资源情感分析
- 作者机构:
- 乌鲁木齐职业大学;
- 关键词:
- 情感分析; 词汇增强; 低资源语言; 多语言模型;
- 期刊名称:
- 智能计算机与应用
- i s s n:
- 2095-2163
- 年卷期:
- 2024 年 14 卷 012 期
- 页 码:
- 82-89
- 摘 要:
- 针对多语言情感分析任务中低资源语言模型词汇量稀少的问题,本文提出一种多语言模型词汇增强的框架。该框架基于齐普夫定律对低频但信息量丰富的词汇进行选择,以扩充低资源语言中的少见词。并结合加权熵对模型词汇表进行优化,以扩充与特定情感任务相关的特异词。然后利用多语言模型预训练和微调进行情感分类。实验结果表明,在印地语和印地语-英语混合语言任务上,提出的框架显著提升了低资源情感分析的性能。本方法不仅改善了低资源语言情感分析的性能,还提高了多语言情感分析的整体适应性。
相关作者
相关机构
