A Transferable Generative Framework for Multi-Label Zero-Shot Learning

人工智能 计算机科学 模式识别(心理学) 特征(语言学) 水准点(测量) 生成模型 判别式 图像(数学) 嵌入 班级(哲学) 对象(语法) 生成语法 哲学 语言学 大地测量学 地理
作者
Peirong Ma,Zhiquan He,Wu Ran,Hong Lu
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:34 (5): 3409-3423 被引量:5
标识
DOI:10.1109/tcsvt.2023.3324648
摘要

Multi-label zero-shot learning (MLZSL) is a more realistic and challenging task than single-label zero-shot learning (SLZSL), which aims to recognize multiple unseen classes in a single image. To adapt generative models to the MLZSL task and better recognize multiple unseen object categories in an image, this paper proposes a Transferable Generative Framework (TGF), which consists of a Multi-Label Semantic Embedding Autoencoders (SEAs), a Semantic-Related Multi-Label Feature Transformation Network (FTN) and a Multi-Label Feature Generation Networks (FGNs). First, SEAs adaptively encodes the class-level word vectors corresponding to each sample containing different number of classes into sample-level semantic embeddings with the same dimension. Then, FTN transforms global features extracted by a CNN pre-trained on single-label images into features that are semantic-related and more suitable for multi-label classification. Finally, FGNs generates both global and local features to better recognize the dominant and minor object categories in a multi-label image, respectively. Extensive experiments on three benchmark datasets show that TGF significantly outperforms state-of-the-arts. Specifically, compared with the previous best generative MLZSL method ( i.e ., Gen-MLZSL), TGF improves the mAP of the ZSL (GZSL) task by 5.4% (6.9%), 20.5% (27.9%), and 2.4% (3.9%) on NUS-WIDE, Open Images, and MS-COCO datasets, respectively.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
Cheney完成签到,获得积分10
1秒前
猫小咪发布了新的文献求助10
1秒前
Moriarty完成签到,获得积分10
1秒前
坚强的芸遥完成签到,获得积分10
1秒前
王晓茜完成签到,获得积分20
2秒前
未道发布了新的文献求助10
2秒前
2秒前
完美麦片完成签到,获得积分10
3秒前
3秒前
衢夭完成签到,获得积分10
4秒前
咿呀咿呀哟完成签到,获得积分0
4秒前
岳欣应助知识进脑子吧采纳,获得10
4秒前
酱酱江将蒋完成签到 ,获得积分10
4秒前
piaopiao1122完成签到,获得积分10
5秒前
求助人员发布了新的文献求助30
5秒前
5秒前
sunwending发布了新的文献求助10
5秒前
luoluo完成签到 ,获得积分10
6秒前
yunfulu29完成签到,获得积分10
6秒前
夏儿完成签到,获得积分10
6秒前
无知的小能手完成签到,获得积分10
6秒前
秋子david发布了新的文献求助10
7秒前
小二郎应助姬会会采纳,获得10
8秒前
活力立诚完成签到,获得积分10
8秒前
duduguai完成签到,获得积分10
8秒前
夏儿发布了新的文献求助10
8秒前
9秒前
Rqbnicsp完成签到,获得积分10
9秒前
9秒前
smottom应助hohokuz采纳,获得10
9秒前
brd完成签到,获得积分10
10秒前
10秒前
Plucky完成签到,获得积分10
10秒前
11秒前
谁来救救我完成签到 ,获得积分10
11秒前
蓝天发布了新的文献求助10
11秒前
11秒前
NexusExplorer应助坚强的芸遥采纳,获得10
11秒前
hhhh完成签到,获得积分10
11秒前
高分求助中
2025-2031全球及中国金刚石触媒粉行业研究及十五五规划分析报告 12000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Cambridge History of China: Volume 4, Sui and T'ang China, 589–906 AD, Part Two 1000
The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 1000
Russian Foreign Policy: Change and Continuity 800
Real World Research, 5th Edition 800
Qualitative Data Analysis with NVivo By Jenine Beekhuyzen, Pat Bazeley · 2024 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5698917
求助须知:如何正确求助?哪些是违规求助? 5127463
关于积分的说明 15223160
捐赠科研通 4853889
什么是DOI,文献DOI怎么找? 2604380
邀请新用户注册赠送积分活动 1555868
关于科研通互助平台的介绍 1514197