摘要:当前网络中存在过度供应、冗余和拥塞等问题,导致能耗过高和用户满意度下降。联合优化能耗和延迟的组播路由问题是一个NP完全问题。在SDN架构下,提出了一种基于多步Q-Learning的多目标组播路由算法来解决延迟和能耗的组播路由问题。该算法旨在降低网络能耗和延迟,同时满足网络性能和QoS的要求。该算法基于多步Q-Learning,能够更准确地估计每条路径的长期奖励,进而通过在每个步骤中更新Q 值,为节点选择最优的动作,并最终找到最佳路径。通过将多个时间步的奖励和价值函数结合起来,能够更快地收敛到最优策略。此外,在设置奖励值时,为每一个目标赋予不同的权重,用来平衡目标所占的比重。仿真结果表明,与现有的代表性算法相比,该算法能够有效降低网络能耗和延迟,提高网络性能。
文章目录
0 引言
1 相关工作
2 系统模型和描述
3 MOMR-MQL算法
3.1 多步强化学习
3.2 算法描述
3.2.1 状态空间
3.2.2 动作空间
3.2.3 奖励值
3.2.4 MOMR-MQL算法描述
4 实验结果
4.1 针对单个组播需求的性能评估
4.1.1 30个节点的网络
4.1.2 50个节点的网络
4.1.3 100个节点的网络
4.2 针对多个组播需求的性能评估
5 结束语