Reinforcement Learning-Based Nonautoregressive Solver for Traveling Salesman Problems

旅行商问题 解算器 强化学习 计算机科学 钢筋 问题解决者 数学优化 人工智能 数学 心理学 算法 计算科学 社会心理学
作者
Yubin Xiao,Di Wang,Boyang Li,Huanhuan Chen,Wei Pang,Xuan Wu,Hao Li,Dong Xu,Yanchun Liang,You Zhou
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:: 1-15 被引量:2
标识
DOI:10.1109/tnnls.2024.3483231
摘要

The traveling salesman problem (TSP) is a well-known combinatorial optimization problem (COP) with broad real-world applications. Recently, neural networks (NNs) have gained popularity in this research area because as shown in the literature, they provide strong heuristic solutions to TSPs. Compared to autoregressive neural approaches, nonautoregressive (NAR) networks exploit the inference parallelism to elevate inference speed but suffer from comparatively low solution quality. In this article, we propose a novel NAR model named NAR4TSP, which incorporates a specially designed architecture and an enhanced reinforcement learning (RL) strategy. To the best of our knowledge, NAR4TSP is the first TSP solver that successfully combines RL and NAR networks. The key lies in the incorporation of NAR network output decoding into the training process. NAR4TSP efficiently represents TSP-encoded information as rewards and seamlessly integrates it into RL strategies, while maintaining consistent TSP sequence constraints during both training and testing phases. Experimental results on both synthetic and real-world TSPs demonstrate that NAR4TSP outperforms five state-of-the-art (SOTA) models in terms of solution quality, inference speed, and generalization to unseen scenarios.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
风夏发布了新的文献求助30
1秒前
1秒前
Harper完成签到,获得积分10
1秒前
w6发布了新的文献求助10
1秒前
1秒前
科研通AI5应助zz采纳,获得10
2秒前
明理青柏发布了新的文献求助10
2秒前
jiapei_1019发布了新的文献求助10
3秒前
Maestro_S应助学呀采纳,获得10
3秒前
wanci应助聪明小黄采纳,获得10
3秒前
bosslin发布了新的文献求助10
4秒前
科研通AI5应助小新采纳,获得10
4秒前
4秒前
航z完成签到,获得积分10
4秒前
NexusExplorer应助小王采纳,获得10
5秒前
kyt发布了新的文献求助10
5秒前
xiao123789发布了新的文献求助10
5秒前
5秒前
biue完成签到,获得积分20
5秒前
平淡夏云发布了新的文献求助30
6秒前
6秒前
ZAy4gG完成签到,获得积分10
6秒前
6秒前
田様应助收拾收拾采纳,获得10
6秒前
6秒前
lion完成签到,获得积分10
7秒前
VDC应助研友_nV2pkn采纳,获得30
7秒前
Binzhiqiang发布了新的文献求助10
7秒前
wk_sea完成签到,获得积分10
7秒前
丘比特应助wizard采纳,获得10
7秒前
Auston_zhong应助包容溪灵采纳,获得10
7秒前
8秒前
LeiDY发布了新的文献求助10
8秒前
紫金之恋发布了新的文献求助10
8秒前
小姚完成签到,获得积分20
9秒前
9秒前
CC完成签到,获得积分10
9秒前
喝喂辉发布了新的文献求助10
10秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Production Logging: Theoretical and Interpretive Elements 3000
CRC Handbook of Chemistry and Physics 104th edition 1000
Density Functional Theory: A Practical Introduction, 2nd Edition 840
J'AI COMBATTU POUR MAO // ANNA WANG 660
Izeltabart tapatansine - AdisInsight 600
Gay and Lesbian Asia 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3756055
求助须知:如何正确求助?哪些是违规求助? 3299291
关于积分的说明 10109581
捐赠科研通 3013845
什么是DOI,文献DOI怎么找? 1655326
邀请新用户注册赠送积分活动 789704
科研通“疑难数据库(出版商)”最低求助积分说明 753361