首页 > 文档 > 学术/知识/论文 > 工程科技与自然科学 > 工业通用技术及设备

声景识音：数字化时代声学场景分类的探索与前沿

2024-05-25 计算机工程1100 1.27M 0

　　摘要：声学场景分类旨在让计算机模拟人类听觉识别不同的声学环境，是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法快速进步，近年来声学场景分类任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程，本篇文章梳理了该领域的早期工作和近期发展，提供对声学场景分类的全面介绍。文章首先描述了声学场景分类的应用场景和面临的挑战；其次详细介绍声学场景分类主流框架，重点阐述应用于此领域的深度学习算法，然后系统性总结声学场景分类前沿探索与延伸任务以及公开数据集；最后对声学场景分类的发展趋势进行探讨与展望。

　　文章目录

　　0 概述

　　1 传统声学场景分类算法

　　1.1 特征提取

　　1.2 传统分类方法

　　2 基于深度学习的声学场景分类算法

　　2.1 特征融合

　　2.2 多声道信息融合

　　2.3 数据增强

　　2.4 网络拓扑结构及模型优化

　　2.4.1 基于卷积神经网络的声学场景分类优化算法

　　2.4.2 基于Attention的声学场景分类算法

　　2.4.3 基于预训练模型的声学场景分类算法

　　3 声学场景分类的前沿探索

　　3.1 深度学习下DCASE2023声学场景分类概述

　　3.2 基于大模型的计算机听觉领域应用

　　4 声学场景分类数据集

　　4.1 DCASE挑战赛数据集

　　4.2 ESC环境声音分类数据集

　　4.3 UrbanSound城市声音分类数据集

　　4.4 AudioSet数据集

　　4.5 FSD50K数据集

　　5 声学场景分类延伸任务

　　5.1 闭集/开集分类任务

　　5.2 低复杂度分类任务

　　5.3 不匹配设备分类任务

　　6 总结与展望

您还没有登录，请登录后查看详情

声学场景分类深度学习音频分类语音识别数据增强

下一篇：加味黄龙汤联合艾灸治疗脓毒症合并急性胃肠损伤的临床研究
上一篇：金属氧化物电催化硝酸盐还原合成氨研究进展

1/26专辑：论文下载

1.24MA型肉毒毒素注射联合悬吊训练治疗痉挛型脑性瘫痪尖足的短期疗效观察

1.16M基于色氨酸-芳香烃受体代谢通路探讨溃疡性结肠炎肠屏障修复的研究进展

1.25M功能近红外光谱成像技术在意识障碍患者残余意识检测中的研究

0.96M无金属酸性条件下催化合成β-溴代烯基硫醚的工艺优化研究

2.2M声表面波-自旋波耦合及磁声非互易性器件

1.37M高温大曲产酯酵母筛选、鉴定及发酵条件

1.48M水平井射孔簇内支撑剂分布数值模拟

1.99M基于反距离权重插值法与BP神经网络对浙江某电镀厂遗留地块土壤重金属健康风险评价及预测

1.02M不同烹饪方式对鹿茸菇营养特性和非挥发性风味物质的影响

1.64M光纤端面耦合周期极化铌酸锂（PPLN）薄膜波导器件的研究

1.74M纵向约束视角下微博反腐的互动逻辑——结合大数据与深度案例的探索

0.94M中国河流及湾区河口中微塑料的赋存输运特性研究进展

1.23M基于UPLC-MS/MS技术分析‘福红’李冷藏期间初生代谢物动态变化规律

1.28M横向流场中矩形喷嘴射流破碎特征的数值研究

0.78M电容去离子脱盐电极材料的研究进展

0.72M多式联运的政企联动机制及政策创新

1.24M高强钢绞线网增强工程水泥基复合材料加固损伤RC梁受弯裂缝分析

0.92M基于运营需求的动车组车队维修策略优化

1.35M花生壳基硬碳孔结构调控及储钠性能研究

1.69M纳米SiO2对硫铝酸盐混凝土负温力学性能与微观结构的影响

0.99M缓释作用对三价锰-焦磷酸盐/亚硫酸盐体系氧化效能的影响

1.72M平行流交叉口车道控制与信号配时组合优化

1.47M基于红外LED线型标靶的掘进机视觉定位方法研究

1.1M猪笼液蛋白酶消减牛乳蛋白致敏表位的研究

0.89M基于LabCar的永磁同步电机建模与验证

2.4M陕北黄土区深剖面不同土地利用方式下土壤水分和温度的分布特征

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注4
~~没有留下签名~~~~

相关文档

	A型肉毒毒素注射联合悬吊训练治疗痉挛型脑性瘫痪尖足的短期疗效观察
	基于色氨酸-芳香烃受体代谢通路探讨溃疡性结肠炎肠屏障修复的研究进展
	功能近红外光谱成像技术在意识障碍患者残余意识检测中的研究
	无金属酸性条件下催化合成β-溴代烯基硫醚的工艺优化研究
	声表面波-自旋波耦合及磁声非互易性器件
	高温大曲产酯酵母筛选、鉴定及发酵条件
	水平井射孔簇内支撑剂分布数值模拟
	基于反距离权重插值法与BP神经网络对浙江某电镀厂遗留地块土壤重金属健康风险评价及预测
	不同烹饪方式对鹿茸菇营养特性和非挥发性风味物质的影响
	光纤端面耦合周期极化铌酸锂（PPLN）薄膜波导器件的研究

本类推荐

	R1234ze（E）替代R134a对二级压缩循环离心压缩机及制冷性能的影响
	相对排气量对两级螺杆压缩式制冷系统性能的影响
	循环抽水作用下阻水型岩溶塌陷机理试验研究
	热阴极电离真空计温度修正的仿真与实验研究
	稀疏单原子气体导热系数的蒙特卡洛模拟
	GB/T 34887—2017《液压传动马达噪声测定规范》的修订建议
	遥感图像判读实验室“教研训考”一体化平台研发
	综合部分负荷性能系数测量不确定度分析
	遥感图像变化检测方法研究综述
	专利知识图谱与TRIZ融合驱动的产品概念设计方法

下载排行