Automatic assessment of spoken-language interpreting based on machine-translation evaluation metrics

NIST公司 计算机科学 公制(单位) 自然语言处理 机器翻译评价 机器翻译 翻译 人工智能 布鲁 人气 可靠性(半导体) 翻译(生物学) 机器学习 机器翻译软件可用性 心理学 基于实例的机器翻译 社会心理学 功率(物理) 运营管理 物理 生物化学 化学 量子力学 信使核糖核酸 经济 基因 程序设计语言
作者
Xiaolei Lu,Chao Han
出处
期刊:Interpreting [John Benjamins Publishing Company]
卷期号:25 (1): 109-143 被引量:10
标识
DOI:10.1075/intp.00076.lu
摘要

Abstract Automated metrics for machine translation (MT) such as BLEU are customarily used because they are quick to compute and sufficiently valid to be useful in MT assessment. Whereas the instantaneity and reliability of such metrics are made possible by automatic computation based on predetermined algorithms, their validity is primarily dependent on a strong correlation with human assessments. Despite the popularity of such metrics in MT, little research has been conducted to explore their usefulness in the automatic assessment of human translation or interpreting. In the present study, we therefore seek to provide an initial insight into the way MT metrics would function in assessing spoken-language interpreting by human interpreters. Specifically, we selected five representative metrics – BLEU, NIST, METEOR, TER and BERT – to evaluate 56 bidirectional consecutive English–Chinese interpretations produced by 28 student interpreters of varying abilities. We correlated the automated metric scores with the scores assigned by different types of raters using different scoring methods (i.e., multiple assessment scenarios). The major finding is that BLEU, NIST, and METEOR had moderate-to-strong correlations with the human-assigned scores across the assessment scenarios, especially for the English-to-Chinese direction. Finally, we discuss the possibility and caveats of using MT metrics in assessing human interpreting.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
对对对发布了新的文献求助10
1秒前
wer发布了新的文献求助10
3秒前
gmugyy发布了新的文献求助10
3秒前
阿文发布了新的文献求助10
3秒前
hjm完成签到,获得积分10
4秒前
4秒前
Hello应助RC_Wang采纳,获得10
5秒前
上官若男应助Piggy采纳,获得10
6秒前
小黄人应助心随以动采纳,获得10
6秒前
刘璐璐完成签到,获得积分10
7秒前
CodeCraft应助灯影采纳,获得10
8秒前
xinqisusu完成签到,获得积分10
8秒前
学术瓦泥匠_harvest完成签到,获得积分10
9秒前
9秒前
乐空思应助wdcpszd采纳,获得30
9秒前
白芷完成签到 ,获得积分10
9秒前
LiSiyi完成签到,获得积分10
10秒前
tianqiwang发布了新的文献求助10
10秒前
许xxxx完成签到 ,获得积分10
10秒前
gzy发布了新的文献求助10
10秒前
11秒前
xmxl完成签到,获得积分10
11秒前
12秒前
molihuakai应助wmbgmt采纳,获得10
12秒前
akko发布了新的文献求助50
13秒前
14秒前
14秒前
桃子完成签到,获得积分10
15秒前
15秒前
缓慢的可乐完成签到,获得积分10
16秒前
17秒前
藏羚羊发布了新的文献求助10
18秒前
Piggy完成签到,获得积分10
19秒前
大学士完成签到,获得积分10
19秒前
19秒前
20秒前
李丽婷发布了新的文献求助10
20秒前
乔达摩悉达多完成签到 ,获得积分0
20秒前
21秒前
doo完成签到,获得积分10
21秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Picture this! Including first nations fiction picture books in school library collections 1500
Signals, Systems, and Signal Processing 610
Unlocking Chemical Thinking: Reimagining Chemistry Teaching and Learning 555
Rheumatoid arthritis drugs market analysis North America, Europe, Asia, Rest of world (ROW)-US, UK, Germany, France, China-size and Forecast 2024-2028 500
17α-Methyltestosterone Immersion Induces Sex Reversal in Female Mandarin Fish (Siniperca Chuatsi) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6365394
求助须知:如何正确求助?哪些是违规求助? 8179324
关于积分的说明 17241158
捐赠科研通 5420478
什么是DOI,文献DOI怎么找? 2867976
邀请新用户注册赠送积分活动 1845142
关于科研通互助平台的介绍 1692604