为促进氢能与综合能源系统中其他能源耦合,提高能源利用灵活性、减少系统碳排放,提出了一种氢耦合电-热综合能源系统(hydrogen coupled electrothermal integrated energy system,HCEH-IES)运行优化方法。首先,对HCEH-IES的各个设备进行数学建模并深入阐述深度强化学习基本原理及双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient, TD3)算法流程,其次,将HCEH-IES的不确定性优化调度问题转化为马尔可夫决策过程(Markov decision process,MDP),并采用TD3算法将优化目标以及约束条件转换为奖惩函数进行连续状态空间和动作空间下的动态调度决策,形成合理的能源分配管理方案。最后,采用历史数据对智能体进行训练,并对比DQN和DDPG算法获得的调度策略。结果表明,基于TD3算法的较其他两种方法获得更好的经济性,更接近于CPLEX日前优化调度方法的经济成本且更适合解决综合能源系统动态优化调度问题,有效实现能源灵活利用,提高综合能源系统的经济性和低碳性。