The encoding method of position embeddings in vision transformer

嵌入 职位(财务) 计算机科学 人工智能 卷积神经网络 编码(内存) 变压器 模式识别(心理学) 人工神经网络 计算机视觉 工程类 财务 电气工程 经济 电压
作者
Kai Jiang,Peng Peng,Youzao Lian,Weisheng Xu
出处
期刊:Journal of Visual Communication and Image Representation [Elsevier]
卷期号:89: 103664-103664 被引量:8
标识
DOI:10.1016/j.jvcir.2022.103664
摘要

In contrast to Convolutional Neural Networks (CNNs), Vision Transformers (ViT) cannot capture sequence ordering of input tokens and require position embeddings. As a learnable fixed-dimension vector, the position embedding improves accuracy while limiting the migration of the model between different input sizes. Hence, this paper conducts an empirical study on position embeddings of pre-trained models, which mainly focuses on two questions: (1) What do the position embeddings learn from training? (2) How do the position embeddings affect the self-attention modules? This paper analyzes the pattern of position embedding in pre-trained models and finds that the linear combination of Gabor filters and edge markers can fit the learned position embeddings well. The Gabor filters and edge markers can occupy some channels to append the position information, and the edge markers have flowed to values in self-attention modules. The experimental results can guide future work to choose suitable position embeddings.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
风中小刺猬完成签到,获得积分10
1秒前
9秒前
XLL发布了新的文献求助10
15秒前
晾猫人完成签到,获得积分10
21秒前
外向白开水完成签到 ,获得积分10
21秒前
22秒前
无足鸟发布了新的文献求助10
27秒前
充电宝应助科研小男孩采纳,获得10
28秒前
luckygirl完成签到 ,获得积分10
28秒前
XLL完成签到,获得积分10
30秒前
文献来来来完成签到,获得积分10
31秒前
32秒前
whuhustwit完成签到,获得积分10
35秒前
Yuzuruyan发布了新的文献求助10
36秒前
orixero应助无足鸟采纳,获得10
39秒前
哟呵完成签到,获得积分10
40秒前
奥拉同学完成签到,获得积分10
40秒前
奋斗的剑完成签到,获得积分10
44秒前
haofan17完成签到,获得积分10
45秒前
哆啦A梦完成签到,获得积分10
46秒前
Yuzuruyan完成签到,获得积分20
47秒前
48秒前
liu发布了新的文献求助10
52秒前
华仔应助liu采纳,获得10
1分钟前
zxj完成签到 ,获得积分20
1分钟前
1分钟前
yi完成签到,获得积分10
1分钟前
爱科研的龙完成签到,获得积分10
1分钟前
朴次次发布了新的文献求助10
1分钟前
充电宝应助科研通管家采纳,获得10
1分钟前
1分钟前
1分钟前
英俊的铭应助欢喜的雁枫采纳,获得10
1分钟前
俭朴天德完成签到,获得积分10
1分钟前
NexusExplorer应助jinxiao采纳,获得10
1分钟前
shuitian998完成签到,获得积分10
1分钟前
1分钟前
U2完成签到,获得积分10
1分钟前
无奈的凌寒完成签到,获得积分10
1分钟前
赛赛完成签到,获得积分10
1分钟前
高分求助中
LNG地上式貯槽指針 (JGA指 ; 108) 1000
LNG地下式貯槽指針(JGA指-107)(LNG underground storage tank guidelines) 1000
Generalized Linear Mixed Models 第二版 1000
Preparation and Characterization of Five Amino-Modified Hyper-Crosslinked Polymers and Performance Evaluation for Aged Transformer Oil Reclamation 700
Operative Techniques in Pediatric Orthopaedic Surgery 510
九经直音韵母研究 500
Full waveform acoustic data processing 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2927275
求助须知:如何正确求助?哪些是违规求助? 2576303
关于积分的说明 6953883
捐赠科研通 2227395
什么是DOI,文献DOI怎么找? 1183771
版权声明 589329
科研通“疑难数据库(出版商)”最低求助积分说明 579304