亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery

情态动词 计算机科学 背景(考古学) 地球观测 合成孔径雷达 一般化 人工智能 比例(比率) 粒度 自编码 边距(机器学习) 模态(人机交互) 遥感 光学(聚焦) 深度学习 机器学习 地理 工程类 地图学 高分子化学 化学 物理 考古 航空航天工程 数学分析 光学 操作系统 数学 卫星
作者
Xueyi Guo,Jiangwei Lao,Bo Dang,Yingying Zhang,Lei Yu,Lixiang Ru,Liheng Zhong,Ziyuan Huang,Kang Wu,Dingxiang Hu,Huimei He,Jian Wang,Jingdong Chen,Mi Yang,Yongjun Zhang,Yansheng Li
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2312.10115
摘要

Prior studies on Remote Sensing Foundation Model (RSFM) reveal immense potential towards a generic model for Earth Observation. Nevertheless, these works primarily focus on a single modality without temporal and geo-context modeling, hampering their capabilities for diverse tasks. In this study, we present SkySense, a generic billion-scale model, pre-trained on a curated multi-modal Remote Sensing Imagery (RSI) dataset with 21.5 million temporal sequences. SkySense incorporates a factorized multi-modal spatiotemporal encoder taking temporal sequences of optical and Synthetic Aperture Radar (SAR) data as input. This encoder is pre-trained by our proposed Multi-Granularity Contrastive Learning to learn representations across different modal and spatial granularities. To further enhance the RSI representations by the geo-context clue, we introduce Geo-Context Prototype Learning to learn region-aware prototypes upon RSI's multi-modal spatiotemporal features. To our best knowledge, SkySense is the largest Multi-Modal RSFM to date, whose modules can be flexibly combined or used individually to accommodate various tasks. It demonstrates remarkable generalization capabilities on a thorough evaluation encompassing 16 datasets over 7 tasks, from single- to multi-modal, static to temporal, and classification to localization. SkySense surpasses 18 recent RSFMs in all test scenarios. Specifically, it outperforms the latest models such as GFM, SatLas and Scale-MAE by a large margin, i.e., 2.76%, 3.67% and 3.61% on average respectively. We will release the pre-trained weights to facilitate future research and Earth Observation applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
10秒前
17秒前
Sunday完成签到 ,获得积分10
23秒前
42秒前
彻底完成签到,获得积分10
48秒前
49秒前
57秒前
Jasper应助科研通管家采纳,获得10
59秒前
阿韦关注了科研通微信公众号
1分钟前
1分钟前
1分钟前
1分钟前
2分钟前
江姜酱先生完成签到,获得积分10
2分钟前
2分钟前
2分钟前
sonya发布了新的文献求助10
2分钟前
完美世界应助小猪采纳,获得10
2分钟前
2分钟前
2分钟前
小猪发布了新的文献求助10
3分钟前
Akim应助ceeray23采纳,获得20
3分钟前
3分钟前
3分钟前
4分钟前
爆米花应助niu采纳,获得10
4分钟前
4分钟前
四斤瓜完成签到 ,获得积分10
4分钟前
传奇3应助科研通管家采纳,获得10
4分钟前
5分钟前
5分钟前
雪白的面包完成签到 ,获得积分10
5分钟前
bji发布了新的文献求助10
5分钟前
niu发布了新的文献求助10
5分钟前
bji完成签到,获得积分10
5分钟前
在水一方应助niu采纳,获得10
5分钟前
sonya完成签到,获得积分10
5分钟前
顾矜应助sonya采纳,获得10
5分钟前
5分钟前
6分钟前
高分求助中
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
A new approach to the extrapolation of accelerated life test data 1000
Indomethacinのヒトにおける経皮吸収 400
基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 370
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
Robot-supported joining of reinforcement textiles with one-sided sewing heads 320
Aktuelle Entwicklungen in der linguistischen Forschung 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3995453
求助须知:如何正确求助?哪些是违规求助? 3535263
关于积分的说明 11267227
捐赠科研通 3275037
什么是DOI,文献DOI怎么找? 1806530
邀请新用户注册赠送积分活动 883349
科研通“疑难数据库(出版商)”最低求助积分说明 809782