Towards Fast and High-Quality Sign Language Production

计算机科学 自回归模型 人工智能 手语 推论 符号(数学) 序列(生物学) 语音识别 模式识别(心理学) 算法 数学 生物 遗传学 数学分析 哲学 语言学 计量经济学
作者
Wen‐Can Huang,Wenwen Pan,Zhou Zhao,Qi Tian
标识
DOI:10.1145/3474085.3475463
摘要

Sign Language Production (SLP) aims to automatically translate a spoken language description to its corresponding sign language video. The core procedure of SLP is to transform sign gloss intermediaries into sign pose sequences (G2P). Most existing methods for G2P are based on sequential autoregression or sequence-to-sequence encoder-decoder learning. However, by generating target pose frames conditioned on the previously generated ones, these models are prone to bringing issues such as error accumulation and high inference latency. In this paper, we argue that such issues are mainly caused by adopting autoregressive manner. Hence, we propose a novel Non-AuToregressive (NAT) model with a parallel decoding scheme, as well as an External Aligner for sequence alignment learning. Specifically, we extract alignments from the external aligner by monotonic alignment search for gloss duration prediction, which is used by a length regulator to expand the source gloss sequence to match the length of the target sign pose sequence for parallel sign pose generation. Furthermore, we devise a spatial-temporal graph convolutional pose generator in the NAT model to generate smoother and more natural sign pose sequences. Extensive experiments conducted on PHOENIX14T dataset show that our proposed model outperforms state-of-the-art autoregressive models in terms of speed and quality.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
满意花卷完成签到 ,获得积分10
2秒前
娇娇大王完成签到,获得积分10
2秒前
SYLH完成签到 ,获得积分0
4秒前
不能吃太饱完成签到,获得积分10
6秒前
请叫我风吹麦浪应助zxd采纳,获得10
8秒前
南城雨落完成签到,获得积分10
8秒前
白子双完成签到,获得积分10
10秒前
林黛玉倒拔垂杨柳完成签到 ,获得积分10
10秒前
panghuhu完成签到 ,获得积分10
10秒前
一一一多完成签到 ,获得积分10
11秒前
科研通AI2S应助温乐松采纳,获得10
12秒前
情怀应助等待秀采纳,获得10
14秒前
Dong完成签到,获得积分10
16秒前
止戈为武完成签到,获得积分10
19秒前
21秒前
21秒前
风信子deon01完成签到,获得积分10
23秒前
今后应助科研通管家采纳,获得10
24秒前
思源应助科研通管家采纳,获得10
24秒前
李健应助LXR采纳,获得10
27秒前
27秒前
闲来逛逛007完成签到 ,获得积分10
27秒前
28秒前
29秒前
sherry完成签到 ,获得积分10
30秒前
科研通AI2S应助......采纳,获得10
31秒前
心有猛虎完成签到,获得积分10
31秒前
等待秀发布了新的文献求助10
33秒前
Jeffrey完成签到,获得积分10
34秒前
刘三哥完成签到,获得积分10
34秒前
dldldl完成签到,获得积分10
35秒前
钮祜禄萱完成签到 ,获得积分10
36秒前
傅勃霖完成签到,获得积分10
36秒前
37秒前
王小凡完成签到 ,获得积分10
42秒前
qqdm完成签到 ,获得积分10
45秒前
你终硕完成签到 ,获得积分10
46秒前
自来也完成签到,获得积分10
47秒前
庄怀逸完成签到 ,获得积分10
48秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2500
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 2000
Applications of Emerging Nanomaterials and Nanotechnology 1111
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
Les Mantodea de Guyane Insecta, Polyneoptera 1000
Neuromuscular and Electrodiagnostic Medicine Board Review 700
지식생태학: 생태학, 죽은 지식을 깨우다 600
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3466849
求助须知:如何正确求助?哪些是违规求助? 3059711
关于积分的说明 9067459
捐赠科研通 2750193
什么是DOI,文献DOI怎么找? 1509066
科研通“疑难数据库(出版商)”最低求助积分说明 697126
邀请新用户注册赠送积分活动 696923