采用双阶段多示例学习网络的语音情感识别

2024-05-19 计算机科学与探索310 1.22M 0

　　摘要：在语音情感识别任务中，当处理不同时长的语音信号时，通常将每句语音信号分割成若干等长片段，然后根据所有片段预测结果的平均值来获得最终的情感分类。然而，这种处理方法要求用户的情绪表达在整个语音信号中是均匀分布的，但是这并不符合实际情况。针对上述问题，提出一种采用双阶段多示例学习网络的语音情感识别方法。第一阶段，将每句语音信号视为“包”，并将其分割成若干等长片段。每个语音片段视为“示例”，并提取多种声学特征，输入到相应的局部声学特征编码器，学习出各自对应的深度特征向量。然后，使用一致性注意力对不同的声学特征进行特征交互和增强。第二阶段，设计一个基于多示例学习的混合聚合器，用于在全局尺度上融合示例预测和示例特征，计算“包”级预测得分。首先，提出一种示例蒸馏模块，用于过滤情感信息较弱的冗余示例。然后，将蒸馏结果组成伪包，采用一种自适应特征聚合策略对伪包进行特征聚合，并通过分类器获得预测结果。最后，将示例级和伪包预测结果进行自适应决策聚合，以获得最终的情感分类结果。该方法在IEMOCAP和MELD公开数据集分别获得73.02%和44.92%的识别率，实验结果表明了该方法的有效性。

　　文章目录

　　1 多示例学习简介

　　2 提出的模型方法

　　2.1 模型概述

　　2.2 局部声学编码器

　　2.2.1 多级特征编码

　　2.2.2 一致性注意力模块

　　2.3 基于多示例学习的混合聚合器

　　2.3.1 示例蒸馏

　　2.3.2 自适应聚合

　　2.3.3 混合聚合

　　3 实验结果及分析

　　3.1 数据集

　　3.2 实验设置

　　3.3 与其它方法比较

　　3.4 消融实验

　　4 结语

您还没有登录，请登录后查看详情

语音情感识别多示例学习示例蒸馏一致性注意力聚合

下一篇：熊鸣峰教授辨治胰十二指肠术后胃瘫经验浅析
上一篇：林带断面形状及布置形式对防护林带防风效应影响的大涡模拟

1/26专辑：论文下载

1.24MA型肉毒毒素注射联合悬吊训练治疗痉挛型脑性瘫痪尖足的短期疗效观察

1.16M基于色氨酸-芳香烃受体代谢通路探讨溃疡性结肠炎肠屏障修复的研究进展

1.25M功能近红外光谱成像技术在意识障碍患者残余意识检测中的研究

0.96M无金属酸性条件下催化合成β-溴代烯基硫醚的工艺优化研究

2.2M声表面波-自旋波耦合及磁声非互易性器件

1.37M高温大曲产酯酵母筛选、鉴定及发酵条件

1.48M水平井射孔簇内支撑剂分布数值模拟

1.99M基于反距离权重插值法与BP神经网络对浙江某电镀厂遗留地块土壤重金属健康风险评价及预测

1.02M不同烹饪方式对鹿茸菇营养特性和非挥发性风味物质的影响

1.64M光纤端面耦合周期极化铌酸锂（PPLN）薄膜波导器件的研究

1.74M纵向约束视角下微博反腐的互动逻辑——结合大数据与深度案例的探索

0.94M中国河流及湾区河口中微塑料的赋存输运特性研究进展

1.23M基于UPLC-MS/MS技术分析‘福红’李冷藏期间初生代谢物动态变化规律

1.28M横向流场中矩形喷嘴射流破碎特征的数值研究

0.78M电容去离子脱盐电极材料的研究进展

0.72M多式联运的政企联动机制及政策创新

1.24M高强钢绞线网增强工程水泥基复合材料加固损伤RC梁受弯裂缝分析

0.92M基于运营需求的动车组车队维修策略优化

1.35M花生壳基硬碳孔结构调控及储钠性能研究

1.69M纳米SiO2对硫铝酸盐混凝土负温力学性能与微观结构的影响

0.99M缓释作用对三价锰-焦磷酸盐/亚硫酸盐体系氧化效能的影响

1.72M平行流交叉口车道控制与信号配时组合优化

1.47M基于红外LED线型标靶的掘进机视觉定位方法研究

1.1M猪笼液蛋白酶消减牛乳蛋白致敏表位的研究

0.89M基于LabCar的永磁同步电机建模与验证

2.4M陕北黄土区深剖面不同土地利用方式下土壤水分和温度的分布特征

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注2
~~没有留下签名~~~~

相关文档

	A型肉毒毒素注射联合悬吊训练治疗痉挛型脑性瘫痪尖足的短期疗效观察
	基于色氨酸-芳香烃受体代谢通路探讨溃疡性结肠炎肠屏障修复的研究进展
	功能近红外光谱成像技术在意识障碍患者残余意识检测中的研究
	无金属酸性条件下催化合成β-溴代烯基硫醚的工艺优化研究
	声表面波-自旋波耦合及磁声非互易性器件
	高温大曲产酯酵母筛选、鉴定及发酵条件
	水平井射孔簇内支撑剂分布数值模拟
	基于反距离权重插值法与BP神经网络对浙江某电镀厂遗留地块土壤重金属健康风险评价及预测
	不同烹饪方式对鹿茸菇营养特性和非挥发性风味物质的影响
	光纤端面耦合周期极化铌酸锂（PPLN）薄膜波导器件的研究

本类推荐

	一种星座模板匹配的MQAM调制盲识别方法
	极地脉冲噪声环境下水声信道时延-多普勒参数估计方法
	稀疏贝叶斯学习在混合场信道估计中的应用
	基于复杂环境的无线电频谱地图构建研究
	基于MBSE的卫星管控流程建模设计
	非均匀噪声下近场太赫兹大规模MIMO目标定位
	工业互联网场景下路径损耗建模研究
	双脉冲相干系统测距测速能力研究与优化
	基于代数关系的轻量级密码DEFAULT统计故障分析
	基于代数关系的轻量级密码DEFAULT统计故障分析

下载排行