摘要:针对晶圆炉管区加工过程中晶圆动态到达、不同工艺类型晶圆不相容和设备预测性维护等问题,以最小化最大完工时间和总拖期为目标,考虑炉管区组批、设备维护选择和批次排序,构建炉管区设备维护-调度联合优化的数学模型。提出基于多目标近端策略优化(MPPO)强化学习的实时调度优化方法。设计组批智能体,根据动态到达的晶圆信息,实现相同工艺类型晶圆的组批;设计设智能体,根据设备的预维护区间,设计一种预维护区间维护调度联合优化策略,依据该优化策略维护设备并确定维护开始时间;设计排序智能体,根据批次的紧急程度和晶圆不同层尽量在同一设备加工的约束,进行批次排序加工决策。引入长短期记忆网络(LSTM)对炉管区调度信息进行记忆和预测,对智能体进行排序,读取组批和设备智能体的决策,并将晶圆加工结束时间反馈给组批和设备智能体,实现智能体之间的交互。根据企业实际生产情况进行案例设计,并与其他算法进行比较,验证了所提MPPO算法的有效性,其具有良好的综合调度性能。
文章目录
1 炉管区设备维护-调度联合优化数学模型
1.1 问题描述
1.2 数学建模
1.2.1 符号与变量定义
1.2.2 模型构建
2 基于MPPO的炉管区设备维护-调度联合优化方法
2.1 MPPO算法框架
2.2 MPPO算法流程
2.3 多目标近端策略优化强化学习算法设计
2.3.1 炉管区调度状态空间
2.3.2 炉管区调度动作空间
2.3.3 炉管区调度奖励函数
2.3.4 基于LSTM的炉管区动态信息交互
2.3.5 预维护区间维护调度联合优化策略
3 试验验证分析
3.1 案例测试
3.2 车间实际案例测试
4 结论