MF 2 ShrT: Multimodal Feature Fusion Using Shared Layered Transformer for Face Anti-spoofing

计算机科学 融合 变压器 面子(社会学概念) 特征(语言学) 人工智能 模式识别(心理学) 欺骗攻击 计算机视觉 语音识别 计算机安全 物理 社会科学 哲学 语言学 量子力学 电压 社会学
作者
Aashania Antil,Chhavi Dhiman
出处
期刊:ACM Transactions on Multimedia Computing, Communications, and Applications [Association for Computing Machinery]
卷期号:20 (6): 1-21 被引量:3
标识
DOI:10.1145/3640817
摘要

In recent times, Face Anti-spoofing (FAS) has gained significant attention in both academic and industrial domains. Although various convolutional neural network (CNN)-based solutions have emerged, multimodal approaches incorporating RGB, depth, and information retrieval (IR) have exhibited better performance than unimodal classifiers. The increasing veracity of modern presentation attack instruments results in a persistent need to enhance the performance of such models. Recently, self-attention-based vision transformers (ViT) have become a popular choice in this field. Their fundamental aspects for multimodal FAS have not been thoroughly explored yet. Therefore, we propose a novel framework for FAS called MF 2 ShrT, which is based on a pretrained vision transformer. The proposed framework uses overlap patches and parameter sharing in the ViT network, allowing it to utilize multiple modalities in a computationally efficient manner. Furthermore, to effectively fuse intermediate features from different encoders of each ViT, we explore a T-encoder-based hybrid feature block enabling the system to identify correlations and dependencies across different modalities. MF 2 ShrT outperforms conventional vision transformers and achieves state-of-the-art performance on benchmarks CASIA-SURF and WMCA, demonstrating the efficiency of transformer-based models for presentation attack detection PAD).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
自觉莫茗完成签到 ,获得积分10
1秒前
会飞的鳄鱼完成签到,获得积分10
2秒前
蛋花肉圆汤完成签到,获得积分10
2秒前
CodeCraft应助一一采纳,获得10
2秒前
天天快乐应助wu采纳,获得150
3秒前
淡漠完成签到 ,获得积分10
4秒前
华仔应助石会发采纳,获得10
4秒前
Makta发布了新的文献求助10
4秒前
玄仙关注了科研通微信公众号
6秒前
7秒前
7秒前
领衔完成签到,获得积分10
8秒前
10秒前
而与白醋发布了新的文献求助50
10秒前
10秒前
还不错完成签到,获得积分10
11秒前
天天快乐应助张点心采纳,获得10
11秒前
11秒前
落日出逃完成签到,获得积分20
11秒前
Lucas应助111采纳,获得10
12秒前
乐乐应助科研废物采纳,获得10
12秒前
星星发布了新的文献求助10
13秒前
13秒前
小二郎应助biu我你开心吗采纳,获得10
13秒前
经百招发布了新的文献求助10
14秒前
zz发布了新的文献求助30
15秒前
YXR完成签到,获得积分10
15秒前
xinghhhe完成签到,获得积分10
16秒前
石会发发布了新的文献求助10
16秒前
浅浅殇完成签到,获得积分10
16秒前
jiang发布了新的文献求助10
17秒前
wu发布了新的文献求助150
19秒前
石会发完成签到,获得积分10
21秒前
英俊的铭应助迷人小白菜采纳,获得10
21秒前
聆听雨完成签到,获得积分10
21秒前
科研通AI2S应助搬工的砖人采纳,获得10
21秒前
22秒前
22秒前
高分求助中
The Oxford Handbook of Social Cognition (Second Edition, 2024) 1050
Kinetics of the Esterification Between 2-[(4-hydroxybutoxy)carbonyl] Benzoic Acid with 1,4-Butanediol: Tetrabutyl Orthotitanate as Catalyst 1000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Chen Hansheng: China’s Last Romantic Revolutionary 500
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3140881
求助须知:如何正确求助?哪些是违规求助? 2791855
关于积分的说明 7800523
捐赠科研通 2448091
什么是DOI,文献DOI怎么找? 1302393
科研通“疑难数据库(出版商)”最低求助积分说明 626548
版权声明 601210