清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

SMTDKD: A Semantic-Aware Multimodal Transformer Fusion Decoupled Knowledge Distillation Method for Action Recognition

计算机科学 可穿戴计算机 传感器融合 人工智能 变压器 稳健性(进化) 卷积神经网络 机器学习 特征提取 模式识别(心理学) 工程类 化学 电压 电气工程 生物化学 基因 嵌入式系统
作者
Zhenzhen Quan,Qingshan Chen,Wei Wang,Moyan Zhang,Xiang Li,Yujun Li,Zhi Liu
出处
期刊:IEEE Sensors Journal [Institute of Electrical and Electronics Engineers]
卷期号:24 (2): 2289-2304
标识
DOI:10.1109/jsen.2023.3337367
摘要

Multimodal sensors, including vision sensors and wearable sensors, offer valuable complementary information for accurate recognition tasks. Nonetheless, the heterogeneity among sensor data from different modalities presents a formidable challenge in extracting robust multimodal information amidst noise. In this paper, we propose an innovative approach, named semantic-aware multimodal transformer fusion decoupled knowledge distillation method (SMTDKD), which not only guides video data recognition through the information interaction between different wearable-sensor data, but also through the information interaction between visual sensor data and wearable-sensor data, improving the robustness of the model. To preserve the temporal relationship within wearable-sensor data, the SMTDKD method converts them into 2D image data. Furthermore, a transformer-based multimodal fusion module is designed to capture diverse feature information from distinct wearable-sensor modalities. To mitigate modality discrepancies and encourage similar semantic features, graph cross-view attention maps are constructed across various convolutional layers to facilitate feature alignment. Additionally, semantic information is exchanged among the teacher-student network, the student network, and BERT-encoded labels. To obtain more comprehensive knowledge transfer, the decoupled knowledge distillation loss is utilized, thereby enhancing the generalization of the network. Experimental evaluations conducted on three multimodal datasets, namely UTD-MHAD, Berkeley-MHAD, and MMAct, demonstrate the superior performance of the proposed SMTDKD method over the state-of-the-art action human recognition methods.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI2S应助科研通管家采纳,获得10
9秒前
Rr完成签到,获得积分10
14秒前
24秒前
呆呆的猕猴桃完成签到 ,获得积分10
1分钟前
Sunny完成签到,获得积分10
1分钟前
1分钟前
1分钟前
不想起昵称完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
勤奋凡之发布了新的文献求助30
1分钟前
研友_nxw2xL完成签到,获得积分10
2分钟前
muriel完成签到,获得积分10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
胖小羊完成签到 ,获得积分10
2分钟前
狄绮完成签到 ,获得积分10
2分钟前
2分钟前
咸鱼发菜发布了新的文献求助30
2分钟前
3分钟前
3分钟前
慕青应助科研通管家采纳,获得30
4分钟前
4分钟前
佩佩完成签到 ,获得积分10
4分钟前
思源应助大意的心锁采纳,获得10
4分钟前
李志全完成签到 ,获得积分10
4分钟前
fuueer完成签到 ,获得积分10
5分钟前
5分钟前
乐乐万岁发布了新的文献求助20
6分钟前
彩色的芝麻完成签到 ,获得积分10
6分钟前
6分钟前
7分钟前
heisa完成签到,获得积分10
7分钟前
乐乐万岁完成签到,获得积分20
7分钟前
8分钟前
8分钟前
Hiker完成签到,获得积分10
9分钟前
lanxinge完成签到 ,获得积分10
9分钟前
9分钟前
科研通AI2S应助科研通管家采纳,获得10
10分钟前
科研通AI2S应助科研通管家采纳,获得10
10分钟前
高分求助中
Aspects of Babylonian celestial divination : the lunar eclipse tablets of enuma anu enlil 1500
中央政治學校研究部新政治月刊社出版之《新政治》(第二卷第四期) 1000
Hopemont Capacity Assessment Interview manual and scoring guide 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Mantids of the euro-mediterranean area 600
Mantodea of the World: Species Catalog Andrew M 500
Insecta 2. Blattodea, Mantodea, Isoptera, Grylloblattodea, Phasmatodea, Dermaptera and Embioptera 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 基因 遗传学 化学工程 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3434823
求助须知:如何正确求助?哪些是违规求助? 3032141
关于积分的说明 8944320
捐赠科研通 2720095
什么是DOI,文献DOI怎么找? 1492148
科研通“疑难数据库(出版商)”最低求助积分说明 689725
邀请新用户注册赠送积分活动 685847