基于强化学习的晶圆炉管区设备维护调度联合优化方法

2024-06-20 东华大学学报(自然科学版)110 1.26M 0

  摘要:针对晶圆炉管区加工过程中晶圆动态到达、不同工艺类型晶圆不相容和设备预测性维护等问题,以最小化最大完工时间和总拖期为目标,考虑炉管区组批、设备维护选择和批次排序,构建炉管区设备维护-调度联合优化的数学模型。提出基于多目标近端策略优化(MPPO)强化学习的实时调度优化方法。设计组批智能体,根据动态到达的晶圆信息,实现相同工艺类型晶圆的组批;设计设智能体,根据设备的预维护区间,设计一种预维护区间维护调度联合优化策略,依据该优化策略维护设备并确定维护开始时间;设计排序智能体,根据批次的紧急程度和晶圆不同层尽量在同一设备加工的约束,进行批次排序加工决策。引入长短期记忆网络(LSTM)对炉管区调度信息进行记忆和预测,对智能体进行排序,读取组批和设备智能体的决策,并将晶圆加工结束时间反馈给组批和设备智能体,实现智能体之间的交互。根据企业实际生产情况进行案例设计,并与其他算法进行比较,验证了所提MPPO算法的有效性,其具有良好的综合调度性能。

  文章目录

  1 炉管区设备维护-调度联合优化数学模型

  1.1 问题描述

  1.2 数学建模

  1.2.1 符号与变量定义

  1.2.2 模型构建

  2 基于MPPO的炉管区设备维护-调度联合优化方法

  2.1 MPPO算法框架

  2.2 MPPO算法流程

  2.3 多目标近端策略优化强化学习算法设计

  2.3.1 炉管区调度状态空间

  2.3.2 炉管区调度动作空间

  2.3.3 炉管区调度奖励函数

  2.3.4 基于LSTM的炉管区动态信息交互

  2.3.5 预维护区间维护调度联合优化策略

  3 试验验证分析

  3.1 案例测试

  3.2 车间实际案例测试

  4 结论



您还没有登录,请登录后查看详情



 

1/26专辑:论文下载

举报收藏 0打赏 0评论 0
相关文档
本类推荐
下载排行
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  蜀ICP备2024057410号-1