首页 > 文档 > 学术/知识/论文 > IT/计算机/信息技术 > 计算机软件及计算机应用

深度神经网络动态分层梯度稀疏化及梯度合并优化方法

2024-05-28 西安交通大学学报390 1.34M 0

　　摘要：针对数据并行方法加速大规模深度神经网络时易出现的通信开销大、训练耗时长、资源利用率不高的问题，提出了一种深度神经网络动态分层梯度稀疏化及梯度合并优化方法。首先，将梯度稀疏化压缩与流水线并行技术相结合，提出动态分层梯度稀疏优化方法，为每层神经网络匹配一个合适的阈值，通过在后续迭代时动态调整该阈值，实现对每层网络传输梯度的自适应压缩。之后，提出了层梯度合并方法，利用动态规划算法对层梯度合并时的通信开销、稀疏化及层梯度计算时间进行权衡优化，求解出最佳的层梯度合并组合，实现将多层小尺度梯度张量合并为一层通信，以降低分层梯度决策时引入的过高通信延迟开销。最后，将求解出的最佳层梯度合并组合应用于具体的训练迭代过程。实验结果表明，所提方法和已有方法相比可在保证模型训练精度的同时，大大降低通信开销，提升模型的训练速度，和未压缩方法相比，训练速度最大可提升1.99倍。

　　文章目录

　　1相关工作

　　1.1梯度压缩

　　1.2梯度分布

　　1.3计算与通信重叠

　　2动态分层梯度稀疏化

　　2.1全局Top-K梯度稀疏化局限性分析

　　2.2动态分层梯度稀疏化方法

　　2.3动态分层梯度压缩算法

　　3层梯度合并

　　3.1层梯度合并策略

　　3.1.1 训练过程分析

　　3.1.2 合并过程分析

　　3.2优化目标

　　3.3层梯度合并算法

　　3.4层合并后训练执行流程

　　4.实验

　　4.1实验设置

　　4.2实验结果与分析

　　4.2.1 并行训练精度、损失对比

　　4.2.2 训练耗时对比

　　4.2.3 压缩性能分析

　　5.结论

您还没有登录，请登录后查看详情

深度神经网络分布式训练同步数据并行梯度压缩层梯度合并

下一篇：结构约束型可编程柔性跃变结构蒙皮设计
上一篇：基于PCAS软件对孔隙结构的定量表征——以川北地区广元千佛崖组砂岩为例

1/26专辑：论文下载

1.24MA型肉毒毒素注射联合悬吊训练治疗痉挛型脑性瘫痪尖足的短期疗效观察

1.16M基于色氨酸-芳香烃受体代谢通路探讨溃疡性结肠炎肠屏障修复的研究进展

1.25M功能近红外光谱成像技术在意识障碍患者残余意识检测中的研究

0.96M无金属酸性条件下催化合成β-溴代烯基硫醚的工艺优化研究

2.2M声表面波-自旋波耦合及磁声非互易性器件

1.37M高温大曲产酯酵母筛选、鉴定及发酵条件

1.48M水平井射孔簇内支撑剂分布数值模拟

1.99M基于反距离权重插值法与BP神经网络对浙江某电镀厂遗留地块土壤重金属健康风险评价及预测

1.02M不同烹饪方式对鹿茸菇营养特性和非挥发性风味物质的影响

1.64M光纤端面耦合周期极化铌酸锂（PPLN）薄膜波导器件的研究

1.74M纵向约束视角下微博反腐的互动逻辑——结合大数据与深度案例的探索

0.94M中国河流及湾区河口中微塑料的赋存输运特性研究进展

1.23M基于UPLC-MS/MS技术分析‘福红’李冷藏期间初生代谢物动态变化规律

1.28M横向流场中矩形喷嘴射流破碎特征的数值研究

0.78M电容去离子脱盐电极材料的研究进展

0.72M多式联运的政企联动机制及政策创新

1.24M高强钢绞线网增强工程水泥基复合材料加固损伤RC梁受弯裂缝分析

0.92M基于运营需求的动车组车队维修策略优化

1.35M花生壳基硬碳孔结构调控及储钠性能研究

1.69M纳米SiO2对硫铝酸盐混凝土负温力学性能与微观结构的影响

0.99M缓释作用对三价锰-焦磷酸盐/亚硫酸盐体系氧化效能的影响

1.72M平行流交叉口车道控制与信号配时组合优化

1.47M基于红外LED线型标靶的掘进机视觉定位方法研究

1.1M猪笼液蛋白酶消减牛乳蛋白致敏表位的研究

0.89M基于LabCar的永磁同步电机建模与验证

2.4M陕北黄土区深剖面不同土地利用方式下土壤水分和温度的分布特征

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注2
~~没有留下签名~~~~

相关文档

	A型肉毒毒素注射联合悬吊训练治疗痉挛型脑性瘫痪尖足的短期疗效观察
	基于色氨酸-芳香烃受体代谢通路探讨溃疡性结肠炎肠屏障修复的研究进展
	功能近红外光谱成像技术在意识障碍患者残余意识检测中的研究
	无金属酸性条件下催化合成β-溴代烯基硫醚的工艺优化研究
	声表面波-自旋波耦合及磁声非互易性器件
	高温大曲产酯酵母筛选、鉴定及发酵条件
	水平井射孔簇内支撑剂分布数值模拟
	基于反距离权重插值法与BP神经网络对浙江某电镀厂遗留地块土壤重金属健康风险评价及预测
	不同烹饪方式对鹿茸菇营养特性和非挥发性风味物质的影响
	光纤端面耦合周期极化铌酸锂（PPLN）薄膜波导器件的研究

本类推荐

	融合风格编码的双通道生成对抗网络步态识别
	大语言模型驱动下知识图谱的构建及应用综述
	面向点击率预估的会话动态兴趣深度推演网络
	一种视/触觉融合的柔性物体抓取力估计方法
	一种自适应融合多模态特征的6D物体位姿估计方法
	模型驱动反卷积网络用于大视场光片图像恢复
	“AIGC+”:虚拟现实媒介内容生产机制研究
	开源软件开发者价值评估体系及其实证研究
	融合上下文引导代价体和深度细化的多视图立体重建
	颗粒图像的颜色校准与表征

下载排行