摘要:针对增量配电网需求侧管理中兼顾供需双方利益的实时定价问题,提出考虑碳交易和可再生能源出力、负荷需求不确定性变化的实时定价模型。该模型由一个双层优化问题组成,其中上层服务提供商的目标是通过选择最优零售电价使其利润最大化,促进可再生能源消纳的同时降低碳排放。下层用户侧通过需求响应控制负荷的能耗以降低综合电力成本。由于可再生能源出力、负荷需求等的不确定性挑战,将实时定价问题描述为马尔可夫决策过程,通过无模型强化学习方法中的Q-learning算法寻找最优定价,该算法仅依靠智能体与环境不断交互过程和奖励反馈机制,自适应系统环境的不确定性变化。仿真结果表明,所提模型和算法能较好的维持系统的供需平衡,在降低碳排放和削峰方面具有良好的性能,同时有效地提高社会福利值。
文章目录
0 引 言
1 系统框架与问题描述
1.1 系统框架
1.2 用户侧模型
1.2.1 不可削减负荷
1.2.2 可削减负荷
1.2.3 不舒适度函数
1.2.4 用户侧综合成本
1.3 服务提供商模型
1.3.1 碳交易成本
1.3.2 服务提供商收益
1.4 目标函数
2 基于RL的实时定价算法
2.1 MDP模拟系统模型
2.1.1 状态空间■
2.1.2 动作空间■
2.1.3 奖励值函数■
2.2 基于Q-learning的实时定价算法实现
3 实验结果与分析
3.1 算例数据与参数设置
3.2 仿真结果及分析
4 结 论