亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Using natural language processing and machine learning to replace human content coders.

计算机科学 可靠性(半导体) 自然语言处理 心理信息 人工智能 样本量测定 样品(材料) 机器学习 数据挖掘 统计 数学 政治学 物理 功率(物理) 化学 量子力学 法学 色谱法 梅德林
作者
Yilei Wang,Jingyuan Tian,Yagizhan Yazar,Deniz S. Öneş,Richard N. Landers
出处
期刊:Psychological Methods [American Psychological Association]
被引量:22
标识
DOI:10.1037/met0000518
摘要

Content analysis is a common and flexible technique to quantify and make sense of qualitative data in psychological research. However, the practical implementation of content analysis is extremely labor-intensive and subject to human coder errors. Applying natural language processing (NLP) techniques can help address these limitations. We explain and illustrate these techniques to psychological researchers. For this purpose, we first present a study exploring the creation of psychometrically meaningful predictions of human content codes. Using an existing database of human content codes, we build an NLP algorithm to validly predict those codes, at generally acceptable standards. We then conduct a Monte-Carlo simulation to model how four dataset characteristics (i.e., sample size, unlabeled proportion of cases, classification base rate, and human coder reliability) influence content classification performance. The simulation indicated that the influence of sample size and unlabeled proportion on model classification performance tended to be curvilinear. In addition, base rate and human coder reliability had a strong effect on classification performance. Finally, using these results, we offer practical recommendations to psychologists on the necessary dataset characteristics to achieve valid prediction of content codes to guide researchers on the use of NLP models to replace human coders in content analysis research. (PsycInfo Database Record (c) 2022 APA, all rights reserved).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
5秒前
6秒前
18秒前
19秒前
科研通AI6应助yq采纳,获得30
19秒前
sanner发布了新的文献求助10
39秒前
ZanE完成签到,获得积分10
42秒前
duola发布了新的文献求助30
44秒前
有趣的银发布了新的文献求助10
47秒前
1分钟前
Orange应助jianglidong采纳,获得10
1分钟前
Criminology34应助懒洋洋采纳,获得10
1分钟前
1分钟前
1分钟前
jianglidong发布了新的文献求助10
1分钟前
jianglidong完成签到,获得积分10
1分钟前
1分钟前
li完成签到 ,获得积分10
1分钟前
Sci发布了新的文献求助10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
a水爱科研发布了新的文献求助10
1分钟前
sanner发布了新的文献求助10
2分钟前
2分钟前
贺俊龙发布了新的文献求助10
2分钟前
a水爱科研完成签到,获得积分10
2分钟前
2分钟前
2分钟前
小马甲应助科研通管家采纳,获得10
2分钟前
FashionBoy应助科研通管家采纳,获得10
2分钟前
2分钟前
endure完成签到,获得积分20
2分钟前
草莓熊1215完成签到 ,获得积分10
2分钟前
2分钟前
疯狂的寻琴完成签到 ,获得积分10
3分钟前
3分钟前
3分钟前
高分求助中
Pipeline and riser loss of containment 2001 - 2020 (PARLOC 2020) 1000
哈工大泛函分析教案课件、“72小时速成泛函分析:从入门到入土.PDF”等 660
Fermented Coffee Market 500
Theory of Dislocations (3rd ed.) 500
Comparing natural with chemical additive production 500
The Leucovorin Guide for Parents: Understanding Autism’s Folate 500
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5232745
求助须知:如何正确求助?哪些是违规求助? 4401980
关于积分的说明 13699520
捐赠科研通 4268389
什么是DOI,文献DOI怎么找? 2342581
邀请新用户注册赠送积分活动 1339573
关于科研通互助平台的介绍 1296302