Advancing Cough Classification: Swin Transformer vs. 2D CNN with STFT and Augmentation Techniques

变压器 计算机科学 医学 人工智能 工程类 电气工程 电压
作者
Malak Ghourabi,Farah Mourad-Chehade,Aly Chkeir
出处
期刊:Electronics [MDPI AG]
卷期号:13 (7): 1177-1177
标识
DOI:10.3390/electronics13071177
摘要

Coughing, a common symptom associated with various respiratory problems, is a crucial indicator for diagnosing and tracking respiratory diseases. Accurate identification and categorization of cough sounds, specially distinguishing between wet and dry coughs, are essential for understanding underlying health conditions. This research focuses on applying the Swin Transformer for classifying wet and dry coughs using short-time Fourier transform (STFT) representations. We conduct a comprehensive evaluation, including a performance comparison with a 2D convolutional neural network (2D CNN) model, and exploration of two distinct image augmentation methods: time mask augmentation and classical image augmentation techniques. Extensive hyperparameter tuning is performed to optimize the Swin Transformer’s performance, considering input size, patch size, embedding size, number of epochs, optimizer type, and regularization technique. Our results demonstrate the Swin Transformer’s superior accuracy, particularly when trained on classically augmented STFT images with optimized settings (320 × 320 input size, RMS optimizer, 8 × 8 patch size, and an embedding size of 128). The approach achieves remarkable testing accuracy (88.37%) and ROC AUC values (94.88%) on the challenging crowdsourced COUGHVID dataset, marking improvements of approximately 2.5% and 11% increases in testing accuracy and ROC AUC values, respectively, compared to previous studies. These findings underscore the efficacy of Swin Transformer architectures in disease detection and healthcare classification problems.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Panini发布了新的文献求助10
刚刚
愤怒的无施完成签到,获得积分10
刚刚
1秒前
量子星尘发布了新的文献求助10
1秒前
小二郎应助Dain采纳,获得10
1秒前
炙热的之双完成签到,获得积分10
1秒前
lulu发布了新的文献求助10
1秒前
wxp5294完成签到,获得积分10
2秒前
gzslwddhjx发布了新的文献求助10
2秒前
小猫宝发布了新的文献求助10
2秒前
2秒前
清脆爆米花完成签到,获得积分10
3秒前
爆米花应助liaofr采纳,获得10
3秒前
矜持完成签到,获得积分10
3秒前
sunshine发布了新的文献求助10
3秒前
penghong发布了新的文献求助10
3秒前
科目三应助飘逸的山彤采纳,获得10
3秒前
Orange应助正正正正采纳,获得10
3秒前
大帅哥发布了新的文献求助20
4秒前
CipherSage应助feng采纳,获得10
4秒前
冲冲冲应助RJ采纳,获得10
4秒前
小飞飞发布了新的文献求助10
4秒前
大观天下发布了新的文献求助10
4秒前
顾大大完成签到,获得积分10
5秒前
ding应助cjl采纳,获得10
5秒前
1218发布了新的文献求助10
6秒前
111完成签到,获得积分10
6秒前
刘果果完成签到,获得积分10
6秒前
我要向阳而生完成签到 ,获得积分10
6秒前
廿一完成签到,获得积分10
6秒前
6秒前
木子发布了新的文献求助10
6秒前
所所应助wjthhhh采纳,获得10
7秒前
7秒前
李健应助温暖的白猫采纳,获得10
7秒前
EgbertW完成签到,获得积分10
7秒前
7秒前
heyuan1001发布了新的文献求助10
8秒前
8秒前
星空完成签到 ,获得积分20
8秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
T/SNFSOC 0002—2025 独居石精矿碱法冶炼工艺技术标准 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6044423
求助须知:如何正确求助?哪些是违规求助? 7811409
关于积分的说明 16245187
捐赠科研通 5190243
什么是DOI,文献DOI怎么找? 2777302
邀请新用户注册赠送积分活动 1760429
关于科研通互助平台的介绍 1643622