A learning to rank approach for cross-language information retrieval exploiting multiple translation resources

计算机科学 秩(图论) 人工智能 跨语言信息检索 翻译(生物学) 机器翻译 自然语言处理 情报检索 数学 生物化学 基因 信使核糖核酸 组合数学 化学
作者
Hosein Azarbonyad,Azadeh Shakery,Heshaam Faili
出处
期刊:Natural Language Engineering [Cambridge University Press]
卷期号:25 (3): 363-384 被引量:9
标识
DOI:10.1017/s1351324919000032
摘要

Abstract Cross-language information retrieval (CLIR), finding information in one language in response to queries expressed in another language, has attracted much attention due to the explosive growth of multilingual information in the World Wide Web. One important issue in CLIR is how to apply monolingual information retrieval (IR) methods in cross-lingual environments. Recently, learning to rank (LTR) approach has been successfully employed in different IR tasks. In this paper, we use LTR for CLIR. In order to adapt monolingual LTR techniques in CLIR and pass the barrier of language difference, we map monolingual IR features to CLIR ones using translation information extracted from different translation resources. The performance of CLIR is highly dependent on the size and quality of available bilingual resources. Effective use of available resources is especially important in low-resource language pairs. In this paper, we further propose an LTR-based method for combining translation resources in CLIR. We have studied the effectiveness of the proposed approach using different translation resources. Our results also show that LTR can be used to successfully combine different translation resources to improve the CLIR performance. In the best scenario, the LTR-based combination method improves the performance of single-resource-based CLIR method by 6% in terms of Mean Average Precision.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
徐小锤完成签到 ,获得积分10
2秒前
titamisulydia完成签到,获得积分10
4秒前
华仔应助nctrung1407采纳,获得10
4秒前
lvlv完成签到 ,获得积分20
4秒前
1234567发布了新的文献求助30
6秒前
彤光赫显完成签到 ,获得积分10
9秒前
冬瓜完成签到,获得积分10
9秒前
9秒前
ni完成签到,获得积分10
9秒前
舒桐发布了新的文献求助20
11秒前
11秒前
Eruri完成签到,获得积分10
11秒前
芒果柠檬完成签到,获得积分10
11秒前
完美世界应助司徒骁采纳,获得10
12秒前
12秒前
可靠橘子发布了新的文献求助10
12秒前
13秒前
友好的半仙完成签到,获得积分10
13秒前
13秒前
周周发布了新的文献求助10
15秒前
CipherSage应助禹平露采纳,获得10
16秒前
XZY发布了新的文献求助10
17秒前
Singularity应助chengchengcheng采纳,获得10
18秒前
旺旺发布了新的文献求助10
18秒前
可靠橘子完成签到,获得积分10
19秒前
白枫完成签到 ,获得积分10
22秒前
22秒前
互助遵法尚德完成签到,获得积分0
25秒前
调皮时光发布了新的文献求助10
25秒前
香蕉觅云应助高高问柳采纳,获得30
26秒前
yah发布了新的文献求助10
27秒前
xiong发布了新的文献求助10
28秒前
嘉心糖应助yk采纳,获得30
30秒前
赘婿应助缥缈傲南采纳,获得10
30秒前
嗒嗒嗒薇完成签到 ,获得积分10
30秒前
31秒前
喝酸奶不舔盖完成签到 ,获得积分10
32秒前
重要的小刘完成签到,获得积分10
32秒前
tianshicanyi发布了新的文献求助10
33秒前
高分求助中
Lire en communiste 1000
Ore genesis in the Zambian Copperbelt with particular reference to the northern sector of the Chambishi basin 800
Becoming: An Introduction to Jung's Concept of Individuation 600
中国氢能技术发展路线图研究 500
Communist propaganda: a fact book, 1957-1958 500
Briefe aus Shanghai 1946‒1952 (Dokumente eines Kulturschocks) 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3168356
求助须知:如何正确求助?哪些是违规求助? 2819704
关于积分的说明 7927634
捐赠科研通 2479614
什么是DOI,文献DOI怎么找? 1321024
科研通“疑难数据库(出版商)”最低求助积分说明 632946
版权声明 602460