基于多步强化学习的多目标组播路由算法

2024-05-26 计算机工程360 0.85M 0

  摘要:当前网络中存在过度供应、冗余和拥塞等问题,导致能耗过高和用户满意度下降。联合优化能耗和延迟的组播路由问题是一个NP完全问题。在SDN架构下,提出了一种基于多步Q-Learning的多目标组播路由算法来解决延迟和能耗的组播路由问题。该算法旨在降低网络能耗和延迟,同时满足网络性能和QoS的要求。该算法基于多步Q-Learning,能够更准确地估计每条路径的长期奖励,进而通过在每个步骤中更新Q 值,为节点选择最优的动作,并最终找到最佳路径。通过将多个时间步的奖励和价值函数结合起来,能够更快地收敛到最优策略。此外,在设置奖励值时,为每一个目标赋予不同的权重,用来平衡目标所占的比重。仿真结果表明,与现有的代表性算法相比,该算法能够有效降低网络能耗和延迟,提高网络性能。

  文章目录

  0 引言

  1 相关工作

  2 系统模型和描述

  3 MOMR-MQL算法

  3.1 多步强化学习

  3.2 算法描述

  3.2.1 状态空间

  3.2.2 动作空间

  3.2.3 奖励值

  3.2.4 MOMR-MQL算法描述

  4 实验结果

  4.1 针对单个组播需求的性能评估

  4.1.1 30个节点的网络

  4.1.2 50个节点的网络

  4.1.3 100个节点的网络

  4.2 针对多个组播需求的性能评估

  5 结束语



您还没有登录,请登录后查看详情



 

1/26专辑:论文下载

举报收藏 0打赏 0评论 0
相关文档
本类推荐
下载排行
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  蜀ICP备2024057410号-1