Capformer: Pure Transformer for Remote Sensing Image Caption

计算机科学 自动汇总 变压器 计算机视觉 人工智能 可扩展性 建筑 图像分辨率 工程类 地理 数据库 电压 电气工程 考古
作者
Junjue Wang,Zihang Chen,Ailong Ma,Yanfei Zhong
标识
DOI:10.1109/igarss46834.2022.9883199
摘要

Accurately describing high-spatial resolution remote sensing images requires the understanding the inner attributes of the objects and the outer relations between different objects. The existing image caption algorithms lack the ability of global representation, which are not fit for the summarization of complex scenes. To this end, we propose a pure transformer (CapFormer) architecture for remote sensing image caption. Specifically, a scalable vision transformer is adopted for image representation, where the global content can be captured with multi-head self-attention layers. A transformer decoder is designed to successively translate the image features into comprehensive sentences. The transformer decoder explicitly model the historical words and interact with the image features using cross-attention layers. The comprehensive and ablation experiments on RSICD dataset demonstrate that the CapFormer outperforms the state-of-the-art image caption methods.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
李健应助斜杠武采纳,获得10
1秒前
fengxj完成签到 ,获得积分10
1秒前
1秒前
1秒前
七七给七七的求助进行了留言
1秒前
2秒前
2秒前
Hello应助冷静的平安采纳,获得10
2秒前
FKVB_完成签到 ,获得积分10
3秒前
饼饼完成签到,获得积分10
3秒前
天天快乐应助木木采纳,获得10
3秒前
艺玲发布了新的文献求助10
3秒前
大气飞丹发布了新的文献求助10
3秒前
丫丫完成签到,获得积分10
4秒前
科研通AI2S应助觅桃乌龙采纳,获得10
4秒前
耿强完成签到,获得积分10
4秒前
wanci应助dd采纳,获得10
5秒前
汉堡包应助cuihl123采纳,获得10
5秒前
李浓完成签到,获得积分10
5秒前
DreamMaker发布了新的文献求助10
5秒前
mao12wang完成签到,获得积分10
6秒前
6秒前
bdvdsrwteges发布了新的文献求助10
7秒前
如约而至发布了新的文献求助20
7秒前
纯真的莫茗完成签到,获得积分10
7秒前
彭于晏应助超11采纳,获得10
8秒前
8秒前
gavincsu发布了新的文献求助10
8秒前
KSGGS给KSGGS的求助进行了留言
8秒前
flow驳回了Aria应助
8秒前
lixiunan完成签到,获得积分10
8秒前
8秒前
dildil发布了新的文献求助10
10秒前
10秒前
11秒前
11秒前
边瑞明完成签到,获得积分10
11秒前
Wang发布了新的文献求助10
12秒前
Jenny应助拼搏思卉采纳,获得10
12秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527699
求助须知:如何正确求助?哪些是违规求助? 3107752
关于积分的说明 9286499
捐赠科研通 2805513
什么是DOI,文献DOI怎么找? 1539954
邀请新用户注册赠送积分活动 716878
科研通“疑难数据库(出版商)”最低求助积分说明 709759