Visual Grounding in Remote Sensing Images

计算机科学 人工智能 计算机视觉 编码器 遥感 地理 操作系统
作者
Yuxi Sun,Shanshan Feng,Xutao Li,Yunming Ye,Jian Kang,Xu Huang
标识
DOI:10.1145/3503161.3548316
摘要

Ground object retrieval from a large-scale remote sensing image is very important for lots of applications. We present a novel problem of visual grounding in remote sensing images. Visual grounding aims to locate the particular objects (in the form of the bounding box or segmentation mask) in an image by a natural language expression. The task already exists in the computer vision community. However, existing benchmark datasets and methods mainly focus on natural images rather than remote sensing images. Compared with natural images, remote sensing images contain large-scale scenes and the geographical spatial information of ground objects (e.g., longitude, latitude). The existing method cannot deal with these challenges. In this paper, we collect a new visual grounding dataset, called RSVG, and design a new method, namely GeoVG. In particular, the proposed method consists of a language encoder, image encoder, and fusion module. The language encoder is used to learn numerical geospatial relations and represent a complex expression as a geospatial relation graph. The image encoder is applied to learn large-scale remote sensing scenes with adaptive region attention. The fusion module is used to fuse the text and image feature for visual grounding. We evaluate the proposed method by comparing it to the state-of-the-art methods on RSVG. Experiments show that our method outperforms the previous methods on the proposed datasets. https://sunyuxi.github.io/publication/GeoVG

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Levan完成签到,获得积分10
刚刚
ZZQ完成签到 ,获得积分10
刚刚
1秒前
chensihao发布了新的文献求助10
2秒前
Yuxuan发布了新的文献求助30
3秒前
月不笑发布了新的文献求助10
4秒前
5秒前
大模型应助疯狂的石头采纳,获得10
5秒前
6秒前
6秒前
6秒前
搜集达人应助Yanyan采纳,获得10
7秒前
Teddyboy发布了新的文献求助10
8秒前
heisebeileimao应助若水采纳,获得200
9秒前
科研通AI2S应助书羽采纳,获得10
10秒前
zl发布了新的文献求助10
10秒前
llb发布了新的文献求助10
10秒前
烟花应助zxd采纳,获得10
11秒前
王帅崽完成签到 ,获得积分10
11秒前
11秒前
水沐林泽完成签到,获得积分10
12秒前
summer完成签到,获得积分10
15秒前
15秒前
15秒前
16秒前
看满天星河完成签到 ,获得积分10
16秒前
康康发布了新的文献求助10
17秒前
bkagyin应助聪慧不评采纳,获得10
19秒前
朱朱发布了新的文献求助10
20秒前
完美世界应助zl采纳,获得10
20秒前
20秒前
能干凝冬发布了新的文献求助10
20秒前
20秒前
深情安青应助Teddyboy采纳,获得10
21秒前
21秒前
ZQ完成签到,获得积分10
23秒前
Jiaocm完成签到,获得积分10
23秒前
24秒前
火星上妙菱完成签到,获得积分10
24秒前
GL发布了新的文献求助10
24秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Digital Twins of Advanced Materials Processing 2000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6039756
求助须知:如何正确求助?哪些是违规求助? 7771167
关于积分的说明 16227940
捐赠科研通 5185772
什么是DOI,文献DOI怎么找? 2775087
邀请新用户注册赠送积分活动 1757977
关于科研通互助平台的介绍 1641955