清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Beyond semantic distance: Automated scoring of divergent thinking greatly improves with large language models

计算机科学 人工智能 任务(项目管理) 考试(生物学) 自然语言处理 机器学习 障碍物 代表(政治) 钥匙(锁) 计算机安全 生物 政治 古生物学 经济 管理 法学 政治学
作者
Peter Organisciak,Selçuk Acar,Denis Dumas,Kelly Berthiaume
出处
期刊:Thinking Skills and Creativity [Elsevier]
卷期号:49: 101356-101356 被引量:64
标识
DOI:10.1016/j.tsc.2023.101356
摘要

Automated scoring for divergent thinking (DT) seeks to overcome a key obstacle to creativity measurement: the effort, cost, and reliability of scoring open-ended tests. For a common test of DT, the Alternate Uses Task (AUT), the primary automated approach casts the problem as a semantic distance between a prompt and the resulting idea in a text model. This work presents an alternative approach that greatly surpasses the performance of the best existing semantic distance approaches. Our system, Ocsai, fine-tunes deep neural network-based large-language models (LLMs) on human-judged responses. Trained and evaluated against one of the largest collections of human-judged AUT responses, with 27 thousand responses collected from nine past studies, our fine-tuned large-language-models achieved up to r = 0.81 correlation with human raters, greatly surpassing current systems (r = 0.12–0.26). Further, learning transfers well to new test items and the approach is still robust with small numbers of training labels. We also compare prompt-based zero-shot and few-shot approaches, using GPT-3, ChatGPT, and GPT-4. This work also suggests a limit to the underlying assumptions of the semantic distance model, showing that a purely semantic approach that uses the stronger language representation of LLMs, while still improving on existing systems, does not achieve comparable improvements to our fine-tuned system. The increase in performance can support stronger applications and interventions in DT and opens the space of automated DT scoring to new areas for improving and understanding this branch of methods.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
研友_Z119gZ完成签到 ,获得积分10
1秒前
姚老表发布了新的文献求助100
10秒前
25秒前
ming发布了新的文献求助10
31秒前
study00122完成签到,获得积分10
33秒前
lhl完成签到,获得积分10
39秒前
Wang完成签到 ,获得积分20
50秒前
55秒前
勤恳的雪卉完成签到,获得积分10
1分钟前
aniu完成签到,获得积分10
1分钟前
1分钟前
嘉欣博博发布了新的文献求助10
1分钟前
lovexa完成签到,获得积分10
1分钟前
嘉欣博博完成签到 ,获得积分20
1分钟前
大勺完成签到 ,获得积分10
1分钟前
人类繁殖学完成签到 ,获得积分10
1分钟前
blusky完成签到,获得积分10
2分钟前
南极的企鹅365完成签到 ,获得积分10
2分钟前
无名草0502完成签到 ,获得积分10
2分钟前
2分钟前
ming发布了新的文献求助10
2分钟前
完美世界应助yanzzz采纳,获得10
2分钟前
上官若男应助ming采纳,获得10
2分钟前
cyskdsn完成签到 ,获得积分10
2分钟前
菠萝包完成签到 ,获得积分10
2分钟前
Never stall完成签到 ,获得积分10
3分钟前
3分钟前
yanzzz发布了新的文献求助10
3分钟前
chcmy完成签到 ,获得积分10
3分钟前
充电宝应助yanzzz采纳,获得10
4分钟前
keyanzhou完成签到 ,获得积分10
4分钟前
lkk183完成签到 ,获得积分10
4分钟前
李冲肖发布了新的文献求助10
4分钟前
zyjsunye完成签到 ,获得积分10
5分钟前
5分钟前
5分钟前
成就书雪完成签到,获得积分10
5分钟前
ming发布了新的文献求助10
5分钟前
yanzzz发布了新的文献求助10
5分钟前
creep2020完成签到,获得积分10
5分钟前
高分求助中
좌파는 어떻게 좌파가 됐나:한국 급진노동운동의 형성과 궤적 2500
Sustainability in Tides Chemistry 1500
TM 5-855-1(Fundamentals of protective design for conventional weapons) 1000
Cognitive linguistics critical concepts in linguistics 800
Threaded Harmony: A Sustainable Approach to Fashion 799
Livre et militantisme : La Cité éditeur 1958-1967 500
氟盐冷却高温堆非能动余热排出性能及安全分析研究 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3052569
求助须知:如何正确求助?哪些是违规求助? 2709826
关于积分的说明 7418232
捐赠科研通 2354383
什么是DOI,文献DOI怎么找? 1245993
科研通“疑难数据库(出版商)”最低求助积分说明 605951
版权声明 595921