Robot Online 3D Bin Packing Strategy Based on Deep Reinforcement Learning and 3D Vision

计算机科学 强化学习 装箱问题 机器人 聚类分析 人工智能 蒙特卡罗树搜索 数学优化 算法 蒙特卡罗方法 箱子 数学 统计
作者
Jie Jia,Huiliang Shang,Xiong Chen
标识
DOI:10.1109/icnsc55942.2022.10004170
摘要

In the field of logistics and warehousing, it is extremely challenging and practically useful to realize an intelligent palletizing robot which can quickly stack and place cartons of various sizes in disorder. The core technology is the solution of the Online 3D Bin Packing Problem (Online 3D-BPP). For the task of estimating the size and pose of objects by robots, we propose an object size and orientation estimation algorithm based on Euclidean clustering of point cloud information, principal components analysis and minimum circumscribed matrix fitting. In order to solve the extremely challenging Online 3D-BPP, we propose a solution strategy by combining deep reinforcement learning (DRL) and Monte Carlo tree search (MCTS) algorithm, which can combine the information of the prospective K objects to be packed to find the best packing scheme. At the same time, we use the improved Actor-Critic algorithm to train the model and introduce the packing configuration tree model based on heuristic rules, which overcomes the disadvantage that DRL cannot converge when the degree of discretization of the action space increases. The extensive evaluation demonstrates that our learned policy achieves a more efficient and robust packing strategy than current state-of-the-art methods and is practically usable for real-world applications.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
luluyang完成签到 ,获得积分10
1秒前
九五式自动步枪完成签到 ,获得积分10
1秒前
顺鑫完成签到 ,获得积分10
3秒前
朱佳宁完成签到 ,获得积分10
6秒前
你在教我做事啊完成签到 ,获得积分10
6秒前
科研通AI2S应助科研通管家采纳,获得10
7秒前
7秒前
十三完成签到 ,获得积分10
9秒前
碧蓝幻灵完成签到 ,获得积分10
10秒前
蛙趣完成签到,获得积分10
13秒前
科研通AI2S应助Alita采纳,获得10
14秒前
JXY完成签到 ,获得积分10
18秒前
暴走完成签到 ,获得积分10
18秒前
18秒前
文龙完成签到 ,获得积分10
21秒前
yuxiao完成签到,获得积分20
21秒前
义气小白菜完成签到 ,获得积分10
22秒前
研友_Z1eDgZ完成签到,获得积分10
23秒前
糯米团子发布了新的文献求助10
24秒前
tfr06完成签到,获得积分10
28秒前
33秒前
zcz完成签到 ,获得积分10
34秒前
nano完成签到 ,获得积分10
39秒前
务实青筠完成签到 ,获得积分10
40秒前
楚襄谷完成签到 ,获得积分10
42秒前
风之微光完成签到,获得积分10
53秒前
有有完成签到 ,获得积分10
1分钟前
动听的飞松完成签到 ,获得积分10
1分钟前
CHENXIN532完成签到,获得积分10
1分钟前
科研通AI2S应助瘦瘦的秋莲采纳,获得10
1分钟前
多边形完成签到 ,获得积分10
1分钟前
abtitw完成签到,获得积分10
1分钟前
Polymer72应助谁能阻挡采纳,获得10
1分钟前
zang完成签到 ,获得积分10
1分钟前
机智樱桃完成签到,获得积分10
1分钟前
杂化轨道退役研究员完成签到,获得积分10
1分钟前
鸡蛋饼波比完成签到 ,获得积分10
1分钟前
曼冬完成签到,获得积分10
1分钟前
娇气的天亦完成签到,获得积分10
1分钟前
缓慢芙完成签到,获得积分10
1分钟前
高分求助中
Solution Manual for Strategic Compensation A Human Resource Management Approach 1200
Natural History of Mantodea 螳螂的自然史 1000
Glucuronolactone Market Outlook Report: Industry Size, Competition, Trends and Growth Opportunities by Region, YoY Forecasts from 2024 to 2031 800
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 500
The analysis and solution of partial differential equations 400
Sociocultural theory and the teaching of second languages 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3339148
求助须知:如何正确求助?哪些是违规求助? 2967059
关于积分的说明 8628100
捐赠科研通 2646545
什么是DOI,文献DOI怎么找? 1449297
科研通“疑难数据库(出版商)”最低求助积分说明 671343
邀请新用户注册赠送积分活动 660176