Predicting Age of Acquisition for Children's Early Vocabulary in Five Languages Using Language Model Surprisal

可预测性 具体性 购置年龄 词汇 计算机科学 按频率列出的单词列表 词(群论) 名词 语言学 自然语言处理 人工智能 心理学 认知心理学 认知 判决 数学 统计 神经科学 哲学
作者
Eva Portelance,Yuguang Duan,Michael C. Frank,Gary Lupyan
出处
期刊:Cognitive Science [Wiley]
卷期号:47 (9)
标识
DOI:10.1111/cogs.13334
摘要

What makes a word easy to learn? Early-learned words are frequent and tend to name concrete referents. But words typically do not occur in isolation. Some words are predictable from their contexts; others are less so. Here, we investigate whether predictability relates to when children start producing different words (age of acquisition; AoA). We operationalized predictability in terms of a word's surprisal in child-directed speech, computed using n-gram and long-short-term-memory (LSTM) language models. Predictability derived from LSTMs was generally a better predictor than predictability derived from n-gram models. Across five languages, average surprisal was positively correlated with the AoA of predicates and function words but not nouns. Controlling for concreteness and word frequency, more predictable predicates and function words were learned earlier. Differences in predictability between languages were associated with cross-linguistic differences in AoA: the same word (when it was a predicate) was produced earlier in languages where the word was more predictable.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
整齐醉冬完成签到,获得积分10
3秒前
3秒前
8秒前
圆缘园完成签到,获得积分10
9秒前
闻山发布了新的文献求助10
10秒前
echo完成签到,获得积分10
10秒前
苗条的怀薇完成签到,获得积分10
11秒前
红色蒲公英完成签到,获得积分20
11秒前
灰灰发布了新的文献求助10
13秒前
苹果朋友完成签到 ,获得积分10
14秒前
15秒前
三三完成签到 ,获得积分10
18秒前
19秒前
酷酷依秋发布了新的文献求助10
20秒前
果称完成签到,获得积分10
20秒前
20秒前
YL完成签到 ,获得积分10
23秒前
23秒前
慕青应助Vincy采纳,获得10
24秒前
yu发布了新的文献求助10
26秒前
WANG完成签到,获得积分10
31秒前
科研通AI6.4应助ChenGY采纳,获得30
32秒前
根号3完成签到 ,获得积分10
33秒前
田様应助anchor采纳,获得20
36秒前
我谈完成签到,获得积分10
36秒前
JamesPei应助酷酷依秋采纳,获得10
41秒前
霸气的香芦完成签到,获得积分10
42秒前
45秒前
45秒前
闻山发布了新的文献求助10
45秒前
天天快乐应助科研通管家采纳,获得20
45秒前
研友_VZG7GZ应助科研通管家采纳,获得10
45秒前
CipherSage应助科研通管家采纳,获得10
46秒前
46秒前
46秒前
CodeCraft应助yu采纳,获得10
46秒前
尚忠富发布了新的文献求助10
51秒前
52秒前
psycho发布了新的文献求助10
52秒前
风趣翠霜完成签到,获得积分10
53秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Picture this! Including first nations fiction picture books in school library collections 1000
Signals, Systems, and Signal Processing 610
Unlocking Chemical Thinking: Reimagining Chemistry Teaching and Learning 555
Photodetectors: From Ultraviolet to Infrared 500
信任代码:AI 时代的传播重构 450
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6357427
求助须知:如何正确求助?哪些是违规求助? 8172077
关于积分的说明 17206842
捐赠科研通 5413092
什么是DOI,文献DOI怎么找? 2864878
邀请新用户注册赠送积分活动 1842345
关于科研通互助平台的介绍 1690526