How do machine translators measure up to human literary translators in stylometric tests?

作者归属 支持向量机 人工智能 计算机科学 自然语言处理 人机系统 校长(计算机安全) 考试(生物学) 度量(数据仓库) 风格(视觉艺术) 主成分分析 人类语言 语言学 数据挖掘 艺术 文学类 哲学 古生物学 生物 操作系统
作者
Changsoo Lee
出处
期刊:Digital Scholarship in the Humanities [Oxford University Press]
卷期号:37 (3): 813-829 被引量:3
标识
DOI:10.1093/llc/fqab091
摘要

Abstract This study aims to test the classification of literary translations by human and machine translators in a bid to explore stylistic distinctions between the two groups and among machine translators and their evolution over 1 year between 2019 and 2020. For this, the study takes a stylometric approach by employing two statistical methods popularly used in authorship attribution—support vector machine (SVM) and principal component analysis (PCA), which are applied to analyzing three types of features—1-grams, 2-grams, and 3 grams. The results show that over the researched period, the three machine translators investigated (Google, Bing, and Papago) moved in the direction of converging in style while advancing toward human translators. The distance gained by them on human translators, however, was not significant enough to challenge the clear-cut divide between the two groups. The PCA tests additionally revealed some characteristics of the machine translator that might be responsible for the stylistic distinction between them and their human counterparts including their tendency of overusing basic standard language.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
happy完成签到,获得积分10
1秒前
hjp完成签到,获得积分10
1秒前
LPH应助hgf采纳,获得10
2秒前
充电宝应助顾志成采纳,获得10
2秒前
3秒前
4秒前
fujun0095完成签到,获得积分10
4秒前
5秒前
happy发布了新的文献求助10
6秒前
在水一方应助热闹的冬天采纳,获得10
6秒前
HH发布了新的文献求助30
8秒前
8秒前
田様应助Alec采纳,获得30
10秒前
spirit 雪完成签到,获得积分10
10秒前
老芋头完成签到,获得积分10
10秒前
yzxzdm完成签到 ,获得积分10
10秒前
11秒前
CipherSage应助yyc采纳,获得10
11秒前
dbdxyty完成签到,获得积分10
13秒前
札七发布了新的文献求助10
13秒前
有魅力山河完成签到,获得积分20
15秒前
15秒前
bkagyin应助科研通管家采纳,获得10
15秒前
充电宝应助科研通管家采纳,获得10
15秒前
科研通AI5应助科研通管家采纳,获得10
15秒前
张文涛发布了新的文献求助10
15秒前
NexusExplorer应助科研通管家采纳,获得10
15秒前
科研通AI5应助科研通管家采纳,获得10
15秒前
Hello应助科研通管家采纳,获得10
15秒前
iNk应助科研通管家采纳,获得20
15秒前
17秒前
没什么想说的完成签到 ,获得积分10
20秒前
让我乔乔完成签到 ,获得积分10
20秒前
yyc发布了新的文献求助10
23秒前
ccc完成签到,获得积分10
25秒前
aaefv完成签到,获得积分10
25秒前
Rainbow完成签到,获得积分10
26秒前
27秒前
Ava应助任乐乐采纳,获得10
27秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Machine Learning Methods in Geoscience 1000
Resilience of a Nation: A History of the Military in Rwanda 888
Essentials of Performance Analysis in Sport 500
Measure Mean Linear Intercept 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3730411
求助须知:如何正确求助?哪些是违规求助? 3275096
关于积分的说明 9991124
捐赠科研通 2990723
什么是DOI,文献DOI怎么找? 1641231
邀请新用户注册赠送积分活动 779610
科研通“疑难数据库(出版商)”最低求助积分说明 748331