亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Fusing Multi-Level Features from Audio and Contextual Sentence Embedding from Text for Interview-Based Depression Detection

计算机科学 嵌入 判决 自然语言处理 萧条(经济学) 人工智能 语音识别 经济 宏观经济学
作者
Junqi Xue,Ruihan Qin,Xinxu Zhou,Honghai Liu,Min Zhang,Zhiguo Zhang
标识
DOI:10.1109/icassp48485.2024.10446253
摘要

Automatic depression detection based on audio and text representations from participants' interviews has attracted widespread attention. However, most of previous researches only used one type of feature of one single modality for depression detection, so that the rich information of audio and text from interviews has not been fully utilized. Moreover, an effective multi-modal fusion approach to leverage the independence among audio and text representations is still lacking. To address these problems, we propose a multi-modal fusion depression detection model based on the interaction of multilevel audio features and text sentence embedding. Specifically, we first extract Low-Level Descriptors (LLDs), mel-spectrogram features, and wav2vec features from the audio. Then we design a Multi-level Audio Features Interaction Module (MAFIM) to fuse these three levels of features for a comprehensive audio representation. For interview text, we use pre-trained BERT to extract sentence-level embedding. Further, to effectively fuse audio and text representations, we design a Channel Attention-based Multi-modal Fusion Module (CAMFM) by taking into account the independence and correlation between two different modalities. Our proposed model shows better performance on two datasets, DAIC-WOZ and EATD-Corpus, than existing methods, so it has a high potential to be applied for interview-based depression detection in practice.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
5秒前
天天快乐应助优雅的涵瑶采纳,获得10
10秒前
这个手刹不太灵完成签到 ,获得积分10
11秒前
16秒前
baymin完成签到 ,获得积分10
18秒前
优雅的涵瑶完成签到,获得积分20
18秒前
22秒前
酷波er应助科研通管家采纳,获得10
22秒前
爱静静应助科研通管家采纳,获得20
22秒前
英俊的铭应助科研通管家采纳,获得10
22秒前
22秒前
27秒前
38秒前
去去去去完成签到,获得积分10
49秒前
53秒前
去去去去发布了新的文献求助30
54秒前
1分钟前
1分钟前
SciGPT应助去去去去采纳,获得10
1分钟前
1分钟前
潘善若发布了新的文献求助10
1分钟前
Perion完成签到 ,获得积分10
1分钟前
潘善若完成签到,获得积分10
1分钟前
kkk驳回了Ava应助
1分钟前
犹豫的晓丝完成签到 ,获得积分10
1分钟前
呆萌的傲蕾完成签到,获得积分20
2分钟前
FashionBoy应助Elena采纳,获得10
2分钟前
李爱国应助呆萌的傲蕾采纳,获得10
2分钟前
落后的西牛完成签到 ,获得积分10
2分钟前
搜集达人应助不安映秋采纳,获得10
2分钟前
侯小菊完成签到,获得积分20
2分钟前
2分钟前
Elena发布了新的文献求助10
2分钟前
科研通AI2S应助Elena采纳,获得10
2分钟前
gaberella发布了新的文献求助10
3分钟前
3分钟前
3分钟前
orixero应助gaberella采纳,获得10
3分钟前
Rn完成签到 ,获得积分10
3分钟前
3分钟前
高分求助中
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Chen Hansheng: China’s Last Romantic Revolutionary 500
宽禁带半导体紫外光电探测器 388
Case Research: The Case Writing Process 300
Global Geological Record of Lake Basins 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3142672
求助须知:如何正确求助?哪些是违规求助? 2793553
关于积分的说明 7806860
捐赠科研通 2449789
什么是DOI,文献DOI怎么找? 1303455
科研通“疑难数据库(出版商)”最低求助积分说明 626950
版权声明 601314