Preserving Word-Level Emphasis in Speech-to-Speech Translation

重点(电信) 计算机科学 副语言 话语 自然性 语音识别 抄写(语言学) 自然语言处理 条件随机场 人工智能 语音合成 语言学 量子力学 电信 物理 哲学
作者
Quoc Truong,Tomoki Toda,Graham Neubig,Sakriani Sakti,Satoshi Nakamura
出处
期刊:IEEE/ACM transactions on audio, speech, and language processing [Institute of Electrical and Electronics Engineers]
卷期号:25 (3): 544-556 被引量:19
标识
DOI:10.1109/taslp.2016.2643280
摘要

Speech-to-speech translation (S2ST) is a technology that translates speech across languages, which can remove barriers in cross-lingual communication. In the conventional S2ST systems, the linguistic meaning of speech was translated, but paralinguistic information conveying other features of the speech such as emotion or emphasis were ignored. In this paper, we propose a method to translate paralinguistic information, specifically focusing on emphasis. The method consists of a series of components that can accurately translate emphasis using all acoustic features of speech. First, linear-regression hidden semi-Markov models (LRHSMMs) are used to estimate a real-numbered emphasis value for every word in an utterance, resulting in a sequence of values for the utterance. After that the emphasis translation module translates the estimated emphasis sequence into a target language emphasis sequence using a conditional random field model considering the features of emphasis levels, words, and part-of-speech tags. Finally, the speech synthesis module synthesizes emphasized speech with LR-HSMMs, taking into account the translated emphasis sequence and transcription. The results indicate that our translation model can translate emphasis information, correctly emphasizing words in the target language with 91.6% F-measure by objective evaluation. A listening test with human subjects further showed that they could identify the emphasized words with 87.8% F-measure, and that the naturalness of the audio was preserved.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
pluto应助pwj采纳,获得10
1秒前
平淡冬亦完成签到 ,获得积分10
1秒前
未若从前i完成签到 ,获得积分10
1秒前
2秒前
淡然以柳完成签到 ,获得积分10
2秒前
Z01发布了新的文献求助20
3秒前
瓜子完成签到,获得积分10
3秒前
暗香浮动月黄昏完成签到,获得积分10
3秒前
我爱学习发布了新的文献求助50
4秒前
YangMengJing_发布了新的文献求助10
4秒前
QDU应助TaoJ采纳,获得50
4秒前
陈强完成签到,获得积分10
4秒前
拉塞尔....完成签到 ,获得积分10
4秒前
5秒前
姜姜完成签到,获得积分10
5秒前
得意忘言完成签到,获得积分10
5秒前
arya完成签到,获得积分10
5秒前
尹俊采完成签到,获得积分10
6秒前
偷得浮生半日闲完成签到,获得积分10
6秒前
腊八蒜发布了新的文献求助10
6秒前
曲沅完成签到,获得积分10
6秒前
7秒前
yuzhang312完成签到,获得积分10
7秒前
7秒前
高兴的鹤完成签到,获得积分10
7秒前
111完成签到,获得积分20
7秒前
7秒前
8秒前
9秒前
小飞象完成签到,获得积分10
9秒前
9秒前
大海完成签到,获得积分20
9秒前
axi完成签到,获得积分10
10秒前
Austin完成签到,获得积分10
11秒前
桐桐应助wqkkk采纳,获得10
11秒前
关关发布了新的文献求助10
12秒前
麻辣味的风完成签到,获得积分10
12秒前
小星星完成签到,获得积分10
12秒前
pluto应助pwj采纳,获得10
12秒前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Effect of reactor temperature on FCC yield 2000
Very-high-order BVD Schemes Using β-variable THINC Method 1020
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 800
Mission to Mao: Us Intelligence and the Chinese Communists in World War II 600
The Conscience of the Party: Hu Yaobang, China’s Communist Reformer 600
An Introduction to Child Language 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3299125
求助须知:如何正确求助?哪些是违规求助? 2934137
关于积分的说明 8467404
捐赠科研通 2607589
什么是DOI,文献DOI怎么找? 1423778
科研通“疑难数据库(出版商)”最低求助积分说明 661689
邀请新用户注册赠送积分活动 645351