Automated Construction of Lexicons to Improve Depression Screening With Text Messages

词典 计算机科学 人工智能 杠杆(统计) 自然语言处理 构造(python库) 机器学习 情报检索 程序设计语言
作者
ML Tlachac,Avantika Shrestha,Mahum Shah,Benjamin Litterer,Elke A. Rundensteiner
出处
期刊:IEEE Journal of Biomedical and Health Informatics [Institute of Electrical and Electronics Engineers]
卷期号:27 (6): 2751-2759 被引量:13
标识
DOI:10.1109/jbhi.2022.3203345
摘要

Given that depression is one of the most prevalent mental illnesses, developing effective and unobtrusive diagnosis tools is of great importance. Recent work that screens for depression with text messages leverage models relying on lexical category features. Given the colloquial nature of text messages, the performance of these models may be limited by formal lexicons. We thus propose a strategy to automatically construct alternative lexicons that contain more relevant and colloquial terms. Specifically, we generate 36 lexicons from fiction, forum, and news corpuses. These lexicons are then used to extract lexical category features from the text messages. We utilize machine learning models to compare the depression screening capabilities of these lexical category features. Out of our 36 constructed lexicons, 14 achieved statistically significantly higher average F1 scores over the pre-existing formal lexicon and basic bag-of-words approach. In comparison to the pre-existing lexicon, our best performing lexicon increased the average F1 scores by 10%. We thus confirm our hypothesis that less formal lexicons can improve the performance of classification models that screen for depression with text messages. By providing our automatically constructed lexicons, we aid future machine learning research that leverages less formal text.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
满意又琴完成签到,获得积分10
2秒前
外向的惜文完成签到,获得积分10
3秒前
4秒前
努力毕业啊完成签到 ,获得积分10
4秒前
haitun发布了新的文献求助10
4秒前
小花生zz发布了新的文献求助100
5秒前
8秒前
8秒前
9秒前
9秒前
10秒前
10秒前
haitun完成签到,获得积分10
11秒前
老金金发布了新的文献求助10
13秒前
王南晰完成签到 ,获得积分10
13秒前
xRuri发布了新的文献求助10
13秒前
科研通AI2S应助科研通管家采纳,获得10
14秒前
Sun应助科研通管家采纳,获得10
14秒前
bkagyin应助科研通管家采纳,获得10
14秒前
思源应助科研通管家采纳,获得10
14秒前
Owen应助科研通管家采纳,获得10
14秒前
烟花应助科研通管家采纳,获得10
14秒前
所所应助科研通管家采纳,获得10
14秒前
lkx发布了新的文献求助10
14秒前
16秒前
爆米花应助Rita采纳,获得50
17秒前
喜悦绿旋发布了新的文献求助10
17秒前
无私的电灯胆完成签到 ,获得积分10
17秒前
天天快乐应助兴奋的果汁采纳,获得10
18秒前
彭于晏应助PG采纳,获得10
19秒前
思嗡发布了新的文献求助10
20秒前
Juli完成签到,获得积分10
21秒前
devilito发布了新的文献求助10
22秒前
852应助兴奋的果汁采纳,获得10
23秒前
小菜鸟001完成签到,获得积分0
25秒前
英俊的铭应助峰宝宝采纳,获得10
26秒前
26秒前
科研通AI5应助张茜采纳,获得10
28秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Machine Learning Methods in Geoscience 1000
Weirder than Sci-fi: Speculative Practice in Art and Finance 960
Resilience of a Nation: A History of the Military in Rwanda 888
Massenspiele, Massenbewegungen. NS-Thingspiel, Arbeiterweibespiel und olympisches Zeremoniell 500
Essentials of Performance Analysis in Sport 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3727963
求助须知:如何正确求助?哪些是违规求助? 3273011
关于积分的说明 9979560
捐赠科研通 2988384
什么是DOI,文献DOI怎么找? 1639597
邀请新用户注册赠送积分活动 778819
科研通“疑难数据库(出版商)”最低求助积分说明 747817