A Survey on Reinforcement Learning for Combinatorial Optimization

强化学习 计算机科学 人工智能 深度学习 组合优化 旅行商问题 扩展(谓词逻辑) 特征(语言学) 最优化问题 数学优化 机器学习 算法 数学 语言学 哲学 程序设计语言
作者
Yunhao Yang,Andrew B. Whinston
标识
DOI:10.1109/aic57670.2023.10263956
摘要

This paper gives a detailed review of reinforcement learning (RL) in combinatorial optimization, introduces the history of combinatorial optimization starting in the 1950s, and compares it with the RL algorithms of recent years. This paper explicitly looks at a famous combinatorial problem-traveling salesperson problem (TSP). It compares the approach of modern RL algorithms for the TSP with an approach published in the 1970s. By comparing the similarities and variances between these methodologies, the paper demonstrates how RL algorithms are optimized due to the evolution of machine learning techniques and computing power. The paper then briefly introduces the deep learning approach to the TSP named deep RL, which is an extension of the traditional mathematical framework. In deep RL, attention and feature encoding mechanisms are introduced to generate near-optimal solutions. The survey shows that integrating the deep learning mechanism, such as attention with RL, can effectively approximate the TSP. The paper also argues that deep learning could be a generic approach that can be integrated with any traditional RL algorithm to enhance the outcomes of the TSP.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Z160完成签到,获得积分10
刚刚
韭菜发布了新的文献求助10
1秒前
1秒前
科研通AI5应助平淡的毛衣采纳,获得10
4秒前
5秒前
5秒前
6秒前
lala完成签到,获得积分20
7秒前
科研通AI5应助韭菜采纳,获得10
7秒前
文毛完成签到,获得积分10
7秒前
後zgw发布了新的文献求助10
8秒前
8秒前
8秒前
晴时有风完成签到,获得积分10
9秒前
xiaofanfan关注了科研通微信公众号
9秒前
10秒前
10秒前
11秒前
dique3hao发布了新的文献求助10
12秒前
Shawnchan发布了新的文献求助10
14秒前
Fluoxetine发布了新的文献求助10
14秒前
14秒前
corner发布了新的文献求助10
15秒前
16秒前
pophoo发布了新的文献求助10
18秒前
科研通AI2S应助杨枝甘露采纳,获得10
18秒前
哈哈完成签到,获得积分20
18秒前
砰砰彭完成签到,获得积分20
19秒前
科研猫发布了新的文献求助10
21秒前
领导范儿应助zzzhy采纳,获得10
21秒前
HK完成签到 ,获得积分10
22秒前
Atlantis发布了新的文献求助10
22秒前
过过过完成签到,获得积分20
24秒前
aaa完成签到,获得积分10
26秒前
张nmky完成签到,获得积分20
26秒前
26秒前
26秒前
26秒前
jxp完成签到,获得积分10
26秒前
sutharsons应助我不是BOB采纳,获得50
27秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Structural Load Modelling and Combination for Performance and Safety Evaluation 1000
Conference Record, IAS Annual Meeting 1977 720
電気学会論文誌D(産業応用部門誌), 141 巻, 11 号 510
Typology of Conditional Constructions 500
Time Matters: On Theory and Method 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3568507
求助须知:如何正确求助?哪些是违规求助? 3140168
关于积分的说明 9436261
捐赠科研通 2841016
什么是DOI,文献DOI怎么找? 1561354
邀请新用户注册赠送积分活动 730535
科研通“疑难数据库(出版商)”最低求助积分说明 718122