亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

See hear now: is audio-visual QoE now just a fusion of audio and video metrics?

计算机科学 水准点(测量) 音质 语音识别 质量(理念) 视听 视频质量 主观视频质量 机器学习 预测建模 质量评定 人工智能 多媒体 图像质量 公制(单位) 工程类 可靠性工程 评价方法 哲学 大地测量学 地理 图像(数学) 认识论 运营管理
作者
Helard Becerra Martinez,Andrew Hines,Mylène C. Q. Farias
标识
DOI:10.1109/qomex55416.2022.9900891
摘要

Single-modal audio/speech and video quality models have reached high levels of performance. Although traditional algorithms are still preferred for many practical applications, advances in machine learning (ML) and deep learning techniques have exceeded their performance in several scientific comparisons. However, audio-visual (AV) models have received signifi-cantly less attention and development. Despite the acknowledged challenge that multimodal interaction poses to the AV problem, traditional AV models generally rely on simple fusion techniques of individual audio and video predictions. Consequently, the impact of recent advances in single-modal quality assessment models on SOTA (state-of-the-art) AV quality models merits attention. This paper presents a revised and updated benchmark for AV quality assessment with particular focus on new speech quality metrics. Three AV datasets were used to test audio, video, and AV quality metrics. For audio and video, the best performing metrics were selected to build simple late-fusion models using their raw predictions. The fused models were then compared to the SOTA AV models. Results show that a simple fusion strategy produces accurate AV quality predictions (LCC and SCC greater than 0.90) with low error rates (RMSE lower than 0.33). These results highlight the influence of advances in speech quality for AV quality assessment.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
28秒前
32秒前
ccob发布了新的文献求助10
1分钟前
机智的硬币完成签到,获得积分10
1分钟前
ccob完成签到,获得积分10
1分钟前
忧郁小鸽子完成签到,获得积分10
1分钟前
1分钟前
星辰大海应助stq1997采纳,获得10
1分钟前
qin发布了新的文献求助10
1分钟前
1分钟前
nojego完成签到,获得积分10
1分钟前
2分钟前
stq1997发布了新的文献求助10
2分钟前
stq1997完成签到,获得积分10
2分钟前
2分钟前
2分钟前
螃蟹One完成签到 ,获得积分10
2分钟前
起风了完成签到 ,获得积分10
2分钟前
Akim应助路卡利欧采纳,获得10
3分钟前
想人陪的飞薇完成签到 ,获得积分10
3分钟前
张林夕完成签到,获得积分20
3分钟前
3分钟前
4分钟前
路卡利欧发布了新的文献求助10
4分钟前
qin完成签到,获得积分10
4分钟前
4分钟前
点点完成签到 ,获得积分10
5分钟前
5分钟前
万能图书馆应助安子采纳,获得10
5分钟前
壹z完成签到 ,获得积分10
5分钟前
5分钟前
安子发布了新的文献求助10
5分钟前
5分钟前
豌豆完成签到 ,获得积分10
6分钟前
6分钟前
6分钟前
丘比特应助张林夕采纳,获得10
6分钟前
7分钟前
7分钟前
7分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
《微型计算机》杂志2006年增刊 1600
Symbiosis: A Very Short Introduction 1500
Einführung in die Rechtsphilosophie und Rechtstheorie der Gegenwart 1500
Binary Alloy Phase Diagrams, 2nd Edition 1000
Air Transportation A Global Management Perspective 9th Edition 700
DESIGN GUIDE FOR SHIPBOARD AIRBORNE NOISE CONTROL 600
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4964951
求助须知:如何正确求助?哪些是违规求助? 4223785
关于积分的说明 13154741
捐赠科研通 4009244
什么是DOI,文献DOI怎么找? 2194300
邀请新用户注册赠送积分活动 1207878
关于科研通互助平台的介绍 1120821