Lexical diversity as a lens into the classification of Slavic languages: A quantitative typology perspective

斯拉夫语 类型学 计算机科学 词汇多样性 自然语言处理 人工智能 语言类型学 透视图(图形) 多样性(政治) 语言学 聚类分析 地理 社会学 词汇 人类学 哲学 考古
作者
Chenliang Zhou,Haitao Liu
出处
期刊:Digital Scholarship in the Humanities [Oxford University Press]
卷期号:38 (3): 1359-1371 被引量:2
标识
DOI:10.1093/llc/fqad042
摘要

Abstract This study proposes a linguistic classification method based on quantitative typology, which leverages a large-scale multilingual parallel corpus to obtain valid language classification result by excluding the influence of covariates such as text genre and semantic content in cross-language comparison. To achieve this, we model the type–token relationships of each Slavic parallel text and calculate the lexical diversity to approximate the morphological complexity of the language. We perform automatic clustering of languages based on these lexical diversity metrics. Our findings show that (1) the lexical diversity metrics can well reflect that the language is located somewhere on the continuum of ‘analytism-synthetism’; (2) the automatic clustering based on these metrics effectively reflects the genealogical classification of Slavic languages; and (3) the geographical distribution of lexical diversity in the region where Slavic languages are spoken shows a monotonic increasing trend from southwest to northeast, which is consistent with the pattern found by previous authors on a global scale. The methodological approach taken in this study is data-driven, with the benefit of being independent of theoretical assumptions and easy for computer processing. This approach can offer a better insight into corpus-based typology and may shed light on the understanding of language as a human-driven complex adaptive system.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
Qintt完成签到 ,获得积分10
2秒前
3秒前
无情明轩发布了新的文献求助10
3秒前
3秒前
小t要读top博完成签到,获得积分10
3秒前
顾矜应助zydong采纳,获得10
4秒前
4秒前
poppy发布了新的文献求助10
4秒前
5秒前
乐乐乐乐乐乐应助SinaiPen采纳,获得10
5秒前
ayang001完成签到 ,获得积分10
5秒前
5秒前
5秒前
5秒前
苁蓉远志完成签到,获得积分10
7秒前
kingwill举报橙子求助涉嫌违规
7秒前
7秒前
SciGPT应助练习者采纳,获得10
8秒前
冷酷的魂幽完成签到,获得积分10
8秒前
今后应助沉默烨霖采纳,获得10
8秒前
8秒前
8秒前
9秒前
乐乐应助故意的友儿采纳,获得10
9秒前
LLY发布了新的文献求助10
10秒前
高兴星发布了新的文献求助10
11秒前
隐形曼青应助卡尔拉采纳,获得10
12秒前
haitun发布了新的文献求助10
13秒前
苁蓉远志发布了新的文献求助100
14秒前
15秒前
15秒前
阿喵完成签到,获得积分10
15秒前
明亮依琴发布了新的文献求助10
15秒前
15秒前
皇室旺完成签到 ,获得积分10
16秒前
山前完成签到,获得积分10
16秒前
火火关注了科研通微信公众号
17秒前
17秒前
17秒前
高分求助中
Continuum Thermodynamics and Material Modelling 4000
Production Logging: Theoretical and Interpretive Elements 2700
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
El viaje de una vida: Memorias de María Lecea 800
Theory of Block Polymer Self-Assembly 750
Luis Lacasa - Sobre esto y aquello 700
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3512208
求助须知:如何正确求助?哪些是违规求助? 3094667
关于积分的说明 9224183
捐赠科研通 2789467
什么是DOI,文献DOI怎么找? 1530709
邀请新用户注册赠送积分活动 711048
科研通“疑难数据库(出版商)”最低求助积分说明 706518