Creating Synthetic Experts with Generative Artificial Intelligence

生成语法 合成生物学 人工智能 计算机科学 工程类 生物 计算生物学
作者
Daniel M. Ringel
出处
期刊:Social Science Research Network [Social Science Electronic Publishing]
被引量:4
标识
DOI:10.2139/ssrn.4542949
摘要

Classification is paramount in today’s data-rich environment as firms increasingly depend on machine learning to distill intelligence from vast amounts of unstructured text such as news articles, reports, and social media. Contemporary classification models can swiftly identify constructs of interest, such as sentiment, authors’ arguments, or product categorizations in textual data. To train an effective classification model, many correctly labeled examples are required. While simple constructs can be labeled via crowdsourcing, more complex constructs necessitate the involvement of expert labelers—a scarce resource. This research leverages generative AI, specifically ChatGPT4, as a surrogate for human expertise in complex classification tasks. It assesses the feasibility of this approach in an empirical study that identifies marketing mix variables in consumers' posts on Twitter. The results demonstrate that, unlike crowdsourced labels, those generated by ChatGPT4 are in high agreement with expert labels. To overcome ChatGPT4's proprietary nature, slow processing speed, and high cost, this research approximates it with an open-source model that is fine-tuned on ChatGPT4's labels. The created “synthetic expert” not only exhibits near parity with ChatGPT4 in terms of expert agreement, but is also highly scalable, fully independent, and free from third-party constraints. The model and code is shared online to rapidly disseminate the potential of synthetic expertise for complex classification tasks across fields and functions in academia and practice.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
mmz完成签到 ,获得积分10
1秒前
fiber关注了科研通微信公众号
1秒前
1秒前
1秒前
所所应助人不犯二枉少年采纳,获得10
1秒前
1秒前
1秒前
舟x完成签到 ,获得积分10
2秒前
2秒前
阿媛呐完成签到,获得积分10
2秒前
创口贴贴发布了新的文献求助10
3秒前
3秒前
3秒前
安详向日葵完成签到 ,获得积分10
3秒前
无花果应助Star1983采纳,获得10
3秒前
以筱发布了新的文献求助10
4秒前
5秒前
小刘发布了新的文献求助10
5秒前
5秒前
李某某发布了新的文献求助30
5秒前
6秒前
JamesPei应助lyh采纳,获得10
6秒前
隐形曼青应助LY采纳,获得10
6秒前
罐头胖听发布了新的文献求助10
7秒前
7秒前
7秒前
lixm发布了新的文献求助10
7秒前
ENHNG完成签到,获得积分10
7秒前
chentong完成签到 ,获得积分10
8秒前
道以文完成签到,获得积分10
9秒前
爱吃脑袋瓜完成签到,获得积分10
9秒前
忧郁紫翠完成签到,获得积分10
9秒前
Zel博博完成签到,获得积分10
9秒前
雪婆发布了新的文献求助10
9秒前
10秒前
亚琳完成签到,获得积分10
11秒前
旭宝儿发布了新的文献求助10
11秒前
云&fudong完成签到,获得积分10
12秒前
余生发布了新的文献求助10
12秒前
天道酬勤完成签到,获得积分10
12秒前
高分求助中
A new approach to the extrapolation of accelerated life test data 1000
‘Unruly’ Children: Historical Fieldnotes and Learning Morality in a Taiwan Village (New Departures in Anthropology) 400
Indomethacinのヒトにおける経皮吸収 400
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 330
Aktuelle Entwicklungen in der linguistischen Forschung 300
Current Perspectives on Generative SLA - Processing, Influence, and Interfaces 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3986618
求助须知:如何正确求助?哪些是违规求助? 3529071
关于积分的说明 11243225
捐赠科研通 3267556
什么是DOI,文献DOI怎么找? 1803784
邀请新用户注册赠送积分活动 881185
科研通“疑难数据库(出版商)”最低求助积分说明 808582