亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Dynamic multi-objective scheduling for flexible job shop by deep reinforcement learning

拖延 计算机科学 强化学习 作业车间调度 调度(生产过程) 工作车间 集合(抽象数据类型) 数学优化 流水车间调度 地铁列车时刻表 人工智能 数学 操作系统 程序设计语言
作者
Shu Luo,Linxuan Zhang,Yushun Fan
出处
期刊:Computers & Industrial Engineering [Elsevier]
卷期号:159: 107489-107489 被引量:119
标识
DOI:10.1016/j.cie.2021.107489
摘要

In modern volatile and complex manufacturing environment, dynamic events such as new job insertions and machine breakdowns may randomly occur at any time and different objectives in conflict with each other should be optimized simultaneously, leading to an urgent requirement of real-time multi-objective rescheduling methods that can achieve both time efficiency and solution quality. In this regard, this paper proposes an on-line rescheduling framework named as two-hierarchy deep Q network (THDQN) for the dynamic multi-objective flexible job shop scheduling problem (DMOFJSP) with new job insertions. Two practical objectives including total weighted tardiness and average machine utilization rate are optimized. The THDQN model contains two deep Q network (DQN) based agents. The higher-level DQN is a controller determining the temporary optimization goal for the lower DQN. At each rescheduling point, it takes the current state features as input and chooses a feasible goal to guide the behaviour of the lower DQN. Four different goals corresponding to four different forms of reward functions are suggested, each of which optimizes an indicator of tardiness or machine utilization rate. The lower-level DQN acts as an actuator. It takes the current state features together with the higher optimization goal as input and chooses a proper dispatching rule to achieve the given goal. Six composite dispatching rules are developed to select an available operation and assign it on a feasible machine, which serve as the candidate action set for the lower DQN. A novel training framework based on double DQN (DDQN) is designed. The trained THDQN is compared with each proposed composite dispatching rule, existing well-known dispatching rules as well as other reinforcement learning based scheduling methods on a wide range of test instances. Results of numerical experiments have confirmed both the effectiveness and generality of the proposed THDQN.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
依然灬聆听完成签到,获得积分10
29秒前
杨明明完成签到,获得积分20
33秒前
小杜发布了新的文献求助10
2分钟前
jason完成签到 ,获得积分10
3分钟前
在水一方应助小杜采纳,获得10
3分钟前
3分钟前
爱静静举报小趴蔡求助涉嫌违规
4分钟前
李剑鸿发布了新的文献求助30
5分钟前
李剑鸿发布了新的文献求助30
5分钟前
Hello应助Grayball采纳,获得30
5分钟前
5分钟前
6分钟前
Grayball发布了新的文献求助30
6分钟前
6分钟前
Fox完成签到 ,获得积分10
7分钟前
Magali发布了新的文献求助10
7分钟前
Legoxpy完成签到,获得积分20
8分钟前
鬼见愁应助科研通管家采纳,获得20
8分钟前
9分钟前
爱静静完成签到,获得积分0
10分钟前
年鱼精完成签到 ,获得积分10
11分钟前
远方关注了科研通微信公众号
11分钟前
11分钟前
Magali发布了新的文献求助30
11分钟前
11分钟前
13分钟前
耶嘿发布了新的文献求助20
13分钟前
Raunio完成签到,获得积分10
13分钟前
李剑鸿发布了新的文献求助500
14分钟前
和谐板栗完成签到 ,获得积分10
14分钟前
14分钟前
李伟发布了新的文献求助10
14分钟前
科研通AI2S应助李伟采纳,获得10
15分钟前
15分钟前
15分钟前
16分钟前
16分钟前
小杜发布了新的文献求助10
16分钟前
赘婿应助科研通管家采纳,获得10
16分钟前
大模型应助兴奋的嘉懿采纳,获得10
16分钟前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
叶剑英与华南分局档案史料 500
Foreign Policy of the French Second Empire: A Bibliography 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3146739
求助须知:如何正确求助?哪些是违规求助? 2798045
关于积分的说明 7826565
捐赠科研通 2454548
什么是DOI,文献DOI怎么找? 1306376
科研通“疑难数据库(出版商)”最低求助积分说明 627708
版权声明 601527