Visual Grounding in Remote Sensing Images

计算机科学 人工智能 计算机视觉 编码器 遥感 地理 操作系统
作者
Yuxi Sun,Shanshan Feng,Xutao Li,Yunming Ye,Jian Kang,Xu Huang
标识
DOI:10.1145/3503161.3548316
摘要

Ground object retrieval from a large-scale remote sensing image is very important for lots of applications. We present a novel problem of visual grounding in remote sensing images. Visual grounding aims to locate the particular objects (in the form of the bounding box or segmentation mask) in an image by a natural language expression. The task already exists in the computer vision community. However, existing benchmark datasets and methods mainly focus on natural images rather than remote sensing images. Compared with natural images, remote sensing images contain large-scale scenes and the geographical spatial information of ground objects (e.g., longitude, latitude). The existing method cannot deal with these challenges. In this paper, we collect a new visual grounding dataset, called RSVG, and design a new method, namely GeoVG. In particular, the proposed method consists of a language encoder, image encoder, and fusion module. The language encoder is used to learn numerical geospatial relations and represent a complex expression as a geospatial relation graph. The image encoder is applied to learn large-scale remote sensing scenes with adaptive region attention. The fusion module is used to fuse the text and image feature for visual grounding. We evaluate the proposed method by comparing it to the state-of-the-art methods on RSVG. Experiments show that our method outperforms the previous methods on the proposed datasets. https://sunyuxi.github.io/publication/GeoVG

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
晓军发布了新的文献求助10
刚刚
刚刚
1秒前
1秒前
YC完成签到,获得积分10
1秒前
吴泽旭发布了新的文献求助10
1秒前
niliuguang发布了新的文献求助10
1秒前
1秒前
千九发布了新的文献求助10
1秒前
格子大王完成签到,获得积分10
1秒前
2秒前
岑不二发布了新的文献求助10
2秒前
2秒前
零柒发布了新的文献求助30
2秒前
酷波er应助豆豆采纳,获得10
3秒前
3秒前
feng完成签到,获得积分10
3秒前
王辰北完成签到,获得积分10
3秒前
3秒前
3秒前
正直亦旋完成签到,获得积分10
3秒前
飒奥完成签到 ,获得积分10
4秒前
4秒前
4秒前
搜集达人应助zpctx采纳,获得10
4秒前
4秒前
慕青应助猪可以搞科研吗采纳,获得10
4秒前
jack发布了新的文献求助10
4秒前
Godzilla完成签到,获得积分10
5秒前
Amber完成签到,获得积分10
5秒前
七秒钟发布了新的文献求助10
5秒前
6秒前
小二郎应助yellow采纳,获得10
6秒前
赘婿应助gao采纳,获得10
6秒前
热心市民小红花应助王恒采纳,获得50
6秒前
supua完成签到 ,获得积分10
6秒前
舒适的素发布了新的文献求助10
6秒前
溪泉发布了新的文献求助10
6秒前
6秒前
Satan发布了新的文献求助10
7秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 2000
Digital Twins of Advanced Materials Processing 2000
Social Cognition: Understanding People and Events 1200
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6038357
求助须知:如何正确求助?哪些是违规求助? 7765535
关于积分的说明 16222645
捐赠科研通 5184403
什么是DOI,文献DOI怎么找? 2774513
邀请新用户注册赠送积分活动 1757394
关于科研通互助平台的介绍 1641690